新聞 > 國際財經 > 正文

☕列印版 ◪圖片版 ◫PDF

OpenAI高層大地震網友：領導層成了空殼

【阿波羅新聞網 2024-08-07 訊】

剛剛，OpenAI高層大地震：

聯創John Schulman辭職跑路，聯創&總裁Greg Brockman長期休假，產品副總裁Peter Deng也被曝離職。

John Schulman（約翰·舒曼），長年領導OpenAI強化學習團隊，被譽為「ChatGPT架構師」。

也是他在Ilya Sustkever離開之後，臨時接管了超級對齊團隊。

現在他宣布「做了一個艱難的決定」，加入隔壁Anthropic，也就是Claude團隊。

與此同時，OpenAI總裁Greg Brockman也宣布將休長假，直到年底。

OpenAI計劃10月1日起在全球各地舉辦開發者日等活動，他也將缺席。

Brockman自述是在連續工作了9年之後第一次放鬆，但對年底之後的計劃說的比較模糊，也有網友認為是出於保密協議。

在舒曼離職官宣20分鐘後，奧特曼在回覆中感謝了舒曼的貢獻，以及回憶了兩人2015年初次見面時的情景。

但截至目前，奧特曼沒有對Brockman休假做任何回應。

奧特曼平常有打字句首字母和「i」不用大寫字母的習慣，但每當重要同事選擇離開時，他都會表現得更正式一些。

著名OpenAI內幕爆料帳號蘋果哥表示：現在領導層已經成了一個空殼，你們還是趕緊發布產品吧。

ChatGPT架構師離職

舒曼本科在加州理工學習物理，在UC伯克利短暫學習過神經科學，後來師從強化學習大牛Pieter Abbeel，完成計算機科學博士學位。

在他成為OpenAI聯創時，博士還未畢業。

OpenAI是他在實習之外工作過的第一家也是唯一一家公司。

他的代表作、最高引論文PPO，也就是ChatGPT核心技術RLHF中選用的強化學習算法。

後來在從GPT-3.5、GPT-4到GPT-4o的一系列工作中都領導了對齊/後訓練團隊。

這次他自述的離職原因也是與此相關：

希望加深對AI對齊的關注，並開啟我職業生涯的新篇章，讓我可以重返實際的技術工作。

不過他也給足了OpenAI面子，補充到「不是因為OpenAI缺乏對安全對齊工作的支持而離開」，只是出於個人希望集中精力。

在ICML2023的演講中，舒曼自述過個人接下來關注的研究方向之一：如何避免過度優化。

ChatGPT中的一些令人討厭的行為（例如過度道歉）是過度優化的結果。

RLHF很容易對狹窄的指標進行過度優化，例如模型可能學會了能獲得獎勵的捷徑，但沒有真正理解。

適當的對話任務訓練需要推理、換位思考和知識，研究人員必須精心設計訓練過程、獎勵功能和數據集

獎勵信號必須評估整個對話的質量，而不僅僅是個別反饋。

在今年五月份與播客主持人Dwarkesh Patel訪談時，舒曼也表示，算力應該更多從預訓練向後訓練轉移。

OpenAI人才持續流失

由於在AI安全方面理念和奧特曼不合，OpenAI的人才發生了大量流失。

今年5月，超級對齊團隊的兩名負責人——首席科學家Ilya Sutskever和RLHF發明者之一Jan Leike，在同一天內相繼離開OpenAI。

彼時離超級對齊團隊的成立，過去還不到一年。

Jan Leike離開後更是連發十幾條推文，對著OpenAI瘋狂炮轟，控訴其沒有兌現20%算力的承諾，並且對安全的重視程度遠不及產品。

後來，Jan Leike選擇加入了OpenAI的競爭對手Anthropic，繼續進行超級對齊的研究。

在GPT-4項目上與Jan Leike共同領導對齊工作的Ryan Lowe，也已於3月底離開OpenAI。

還有超級對齊成員之一William Saunders，以及參與過GPT-4對抗性測試的Daniel Kokotajlo，也都從OpenAI離職。

更不必說隔壁Anthropic的創始人Dario Amodei和Daniela Amodei兄妹，也是OpenAI出身。

哥哥Dario離開前是OpenAI的研究副總裁，妹妹Daniela則是安全與策略部門副總監，走的時候還把GPT-3首席工程師Tom Brown等十幾名員工一起帶到了Anthropic。

導致他們選擇出走創業的原因之一，就是OpenAI在安全問題尚未解決的情況下就直接發布了GPT-3，引發了他們的不滿。

對安全的重視，加上創始人的背景，也讓Anthropic成為了包括Jan Leike和這次離職的舒曼在內的OpenAI員工的主要去處之一。

OpenAI這邊最近在安全工作上也有所動作——

7月末，OpenAI把安全部門高級主管Aleksander Madry調離了安全崗位，並給他重新分配了「AI推理」的工作。

但OpenAI告訴媒體，Madry到了新職位上之後，仍將致力於人工智慧安全工作。

CEO奧特曼也是強調，OpenAI一直都很重視安全工作，並堅持了「給整個安全團隊至少20%算力」的承諾。

但眼尖的網友很快發現，奧特曼玩了一波偷換概念，原來承諾的是給超級對齊團隊20%算力，被偷偷改成了全部安全團隊。

所以，在奧特曼的推文之後，網友也是毫不留情地把這一背景信息添加了上去，並附上了當時OpenAI的官方連結。

emm……網際網路還是有記憶的。

One More Thing

在內部大量人才流失的同時，OpenAI的「老仇人」馬斯克這邊也有新的動作——

馬斯克剛剛再一次把OpenAI告上了法庭，一同被告的還有奧特曼以及總裁Brockman。

這次起訴的理由是，馬斯克認為自己參與創立OpenAI之時受到了奧特曼和Brockman的「欺騙和敲詐勒索」。

馬斯克稱，自己當初參與並投資OpenAI就是因為相信了奧特曼的話，當時奧特曼承諾OpenAI是一個安全、開放的非營利組織。

但後來OpenAI成為了營利性組織，還把一部分股份賣給了微軟，這讓馬斯克感到十分不滿，認為自己遭到了背叛，痛斥奧特曼「背信棄義」。

馬斯克的律師Marc Toberoff表示，此次訴訟和之前撤回的那起有很大差別，要求被告「對故意向馬斯克和公眾做出虛假陳述的行為負責」，並尋求「大規模追回他們的不義之財」。

同時，起訴書還要求撤銷OpenAI對微軟授予的許可。

責任編輯：方尋　來源：量子位轉載請註明作者、出處並保持完整。

本文網址：https://tw.aboluowang.com/2024/0807/2088307.html

相關新聞