新聞 > 科教 > 正文

OpenAI首席產品官:2027年AI會超越人類

達沃斯世界經濟論壇正在瑞士召開,不必多說,人工智慧是本屆會議的重要主題。

全面超越:2027年的確可能會有全面超越人類的智能,不過,也可能更早。

新產品:o3會推出,包括 o3迷你版,但人形機器人不會在今年。

多邊合作:無論是蘋果還是微軟,都是在理解、承載 AI的同時,藉由他們的產品走向千萬用戶面前的渠道。跟他們的合作是打開更多扇門。

虧損問題:用戶總是希望儘可能「壓榨」訂閱計劃的價值,20美元的月費,要帶來超過20美元的價值。200美元的付費計劃受到高級用戶的歡迎,使用量也很大,每月的計算資源使用量實際上超過了200美元的價值。不過未來成本會繼續下降,這個模式不會永遠持續。

Sam Altman是最好的人類。

以下為訪談對話整理,內容有所刪減。

主持人

OpenAI最近涉及了很多跟晶片有關的內容,我們未來會看到進展。我想了解一些產品方面的東西。你是產品負責人,所以我想我們可以通過你了解那些已經宣布、或我們曾聽說過的產品,何時會推出。

Kevin Weil

好的,很酷,這就是我們在這裡要做的。

主持人

GPT-o3快來了嗎?

Kevin Weil

是的,我們對這個模型非常興奮。如果你願意的話,讓我退後一步,確保大家理解這些模型是什麼。

我們目前在這個領域看到了一系列趨勢,模型正變得越來越便宜。你可以比較一下兩年前我們發布的 GPT-3和現在的 GPT-4,成本相差了100倍。也就是說,GPT-3的成本比現在高了100倍。我們看到價格在兩年內下降了99%。

與此同時,模型正變得越來越智能,它們變得更快、更安全。

這些趨勢令人難以置信,我不知道你在其他地方是否能看到這樣的情況:成本下降了99%,同時這些模型變得更快、更智能、更安全。

想必大家對 GPT-4都不陌生。你們可能默認在 ChatGPT中使用它。去年年底,我們宣布了一項研究突破,並將其應用到了一個名為o1的模型中。

這個命名方式實際上完全不同,部分原因是這個模型能夠做到 GPT-4無法做到的事情——它能夠進行推理。當然,GPT-4已經非常出色了。它知道很多東西,你可以問它問題,它會迅速給出答案。

而 O系列模型,比如 o1及其後續版本,實際上具備更深層次的思考能力。

舉個例子,如果我問你一個難題,比如讓你做一個填字遊戲,你不會直接開始給出答案,對吧?

你會先看看題目,然後可能會想:「嗯,第一個空,我有幾個可能的答案,但不確定是哪個。」接著,如果你發現第三個字母是A,你可能會推斷:「哦,那答案一定是這個。」這種逐步推理的能力是 O系列模型的特點。就像建立假設,測試那些假設。

有時候你會推翻一些假設,有時候你會確認它們,然後在此基礎上繼續推進,最終解決問題。這就是我們解決任何難題的方式,無論是預訂航班還是進行科學研究,都是如此。

而現在,這些模型首次具備了這樣的能力。不僅如此,它們不僅在推理能力上超越了GPT-4,而且在任何衡量標準下都顯得更加智能。

o3可以說是下一個版本。我們跳過一個數字是因為電信營運商有一個名為 O2的網絡,為了避免混淆,我們直接跳到了o3。

主持人

我當時想,哦,這種做法真是一個巨大的飛躍。我們真的已經取得了很大的進步。

Kevin Weil

我們從 o1到 o3隻用了大約三個月的時間,這意味著疊代周期正在大幅縮短。而且,我們已經開始訓練 o3之後的模型了。看起來,我們將再次看到能力的巨大飛躍。這就是為什麼我們對此感到非常興奮——模型正在以極快的速度變得非常智能。

當我們發布 o1的預覽版時,我們對這些模型進行基準測試的一種方式,尤其是在編程方面,是讓它們參加類似於競爭性編程比賽的活動。

這是一個很好的基準測試方法,因為這些任務可以異步完成。你可以讓模型像人類一樣參加比賽,並以與人類相同的方式進行評分。

這些模型的第一個版本大概相當於排名第一百萬的程式設計師,雖然聽起來不算特別出色,但依然能排在全球前2%到3%。而第二個版本,也就是我們正式發布的新模型 o1的完整版,已經相當於全球排名前1000的軟體工程師了。

這些競爭性編程問題,o3版本將相當於全球排名第175的工程師。而且,從 o1到 o3隻用了大約3到5個月的時間。你可以看到,我們從排名第一百萬提升到了第175名,所以你可以想像未來隨著我們不斷取得有意義的進展,這個排名還會繼續提升。這就是為什麼我們對這些模型感到如此興奮。

通常,我們會發布兩個版本的模型。一個是迷你版本,它保留了核心能力,比如數學和軟體工程方面的能力,但不會保留所有的世界知識。不過,它的推理速度非常快,成本也很低。

另一個是完整版模型,它整合了所有功能。因此,我們會很快發布 o3的迷你版本,隨後再推出 o3的完整版。

我之前說過,如果一切順利的話,我們預計會在二月到三月之間發布。這就是我們的目標。

主持人

我們接下來會深入討論你剛才提到的內容,這些信息非常有幫助,而且我認為這實際上為我想問的下一個產品——智能代理(agents)——奠定了基礎。

Kevin Weil

令人驚嘆。

主持人

時間表如何?

Kevin Weil

我認為2025年將是智能代理真正實現的一年,我們將從現在的狀態邁入一個新的階段。目前,如果你使用ChatGPT,主要是用它來回答問題,對吧?你問它一個問題,它給你一個答案,你再問,它再答。

但到了2025年,ChatGPT將開始在現實世界中為你做事。當我思考自己的一天,或者我在瀏覽器中花費時間的方式時,我發現其中大約一半的活動是我真正感興趣的,比如我閱讀《華爾街日報》上你寫的文章,或者看YouTube視頻,或者我在瀏覽器中做的事情,那些是我真正感興趣的。

而另一半時間,我可能在填寫我孩子的足球報名表之類的事情,這可能會占用我一天中的30分鐘,我真的很希望這30分鐘能省下來。

為什麼不能讓 AI幫我做這些事呢?

這就是 ChatGPT未來能夠為你做的事情。

我們不僅在開發我剛才提到的推理能力,還在研究所謂的多模態功能,讓 ChatGPT不僅能理解你輸入的文字,還能以我們人類互動的方式進行交流。它可以與你對話,你也可以與它對話,而且它能理解大約50到100種語言。

它還能「看」,比如你可以用手機攝影頭對準某個場景,它能理解發生了什麼;它也能查看你的瀏覽器屏幕,像你我一樣理解瀏覽器中的內容。它不是通過解析HTML來實現的,而是通過觀察屏幕上的視覺元素來理解它們的含義。比如,這是一個搜索框,如果我點擊這裡,會發生什麼,等等。

一旦你掌握了這些基本功能,你就可以開始構建這些智能代理了。這就像我們在為人們解決問題,幫你節省那些本來會被瑣事占據的時間,讓你能去做真正重要的事情。

主持人

讓我稍微回顧一下,我在想像一個工具。我想像的是這樣的,你告訴我這是否是你們正在構建的東西:它能看見我電腦屏幕上的內容,我告訴它「去填寫我孩子的午餐表」。

也許我需要稍微具體一點說明,然後我按下確認鍵,它就能去完成這個任務。它能提交嗎?這個想法是它不僅能夠執行這個動作,還能更進一步真正完成這個動作嗎?

Kevin Weil

是的,而且關於發布日期,我可以告訴你一個更好的消息:我們已經發布了部分這樣的功能。

如果你使用我們的 Mac和 Windows桌面應用程式(你可以下載它),而不是在瀏覽器標籤頁中使用,那麼你可以做更多的事情。當然,在你的許可下,ChatGPT可以查看整個屏幕,看到你正在使用的應用程式以及你在做什麼。

我們要求你在它查看任何特定窗口之前必須明確授權,但它已經可以做一些事情,比如如果你在編寫代碼或使用終端時遇到編譯器錯誤,你可以直接說:「看看這個應用程式,我該怎麼辦?如何修復它?」它可以讀取屏幕上的內容並告訴你解決方法。這樣你就不用反覆複製粘貼了。

在不久的將來,你可以想像它會直接說:「哦,是的,讓我幫你修復這個問題。」所以,我們已經通過桌面應用程式實現了這些功能,接下來就是更廣泛地推廣這些功能。

Kevin Weil

你是說今年?

Kevin Weil

是的,絕對。我的意思是,你將在第一季度開始看到這些功能逐步推出。我們希望通過這種方式讓人們擁有更多的控制權。

模型並不完美,在 Q1或 Q2也不會變得完美。它們仍然會犯錯。當它們在現實世界中為你做事時,這些錯誤可能會帶來更嚴重的後果,比它回答你一個問題時出錯的影響更大。

因此,我們正在努力研究如何確保我們能夠理解哪些操作是可逆的,哪些是不可逆的,並讓你能夠控制它實際要採取的任何行動。

它會為你填寫表格,然後說:「嘿,我完成了,你來點擊提交吧?」在某些情況下,你可能已經多次使用它,對它足夠信任,願意讓它直接點擊提交。

但如果你讓它去亞馬遜為你訂購東西,你可能不希望它直接點擊提交,而是希望它把商品加入購物車,然後等你回來確認。因此,我們需要教會模型在這些檢查點停下來,準備好一切,然後讓人來做最終決定。

我想,隨著模型的改進和我們對它們的了解加深,這個界限可能會逐漸變化,人們也會對它們產生更多信任。但我們希望確保人們始終擁有控制權。

主持人

這確實是在逐步建立信任的過程,有點像 AI版本的「信任測試」。

Kevin Weil

對的,很好的說法。

主持人

我再問一個或兩個產品的問題,然後我們會討論一些其他話題。我們已經討論了 o3的相關內容,包括 o3迷你版,你們之前承諾為創作者提供一個退出訓練的工具,這個進展如何?

Kevin Weil

關於這個工具,我們仍在開發中,後續會有更多信息公布,我們也會進一步說明。

主持人

好,人形機器人呢?

Kevin Weil

不在今年。

主持人

不在今年。好的,我們有一年的時間,那很棒。明年。

Kevin Weil

說實話,我認為這將是下一個重大突破,無論是我們還是其他公司。我認為 AI最初對我們所有人以及我們如何利用時間產生重大影響的最自然領域是數字領域,因為這些技術本質上是數位化的,這是最自然的起點。

但隨著我們開發出多模態功能、語音能力、視覺能力,並開始理解現實世界,機器人技術顯然是下一步。所以我認為,無論是我們還是其他公司,機器人技術的發展可能比當前我們正在經歷的這場幫命晚兩三年。

認為今年對 AI以及它如何影響和改善我們的生活來說將是至關重要的一年。而我的猜測是,機器人技術的突破可能還需要兩到三年的時間。

主持人

但你們也在努力,對吧?就像重新啟動機器人研究實驗室的一部分。

Kevin Weil

是的,我們開始考慮這個問題了。你可以想像一個小團隊正在嘗試探索,試圖理解這是否真的是一個我們可以產生重大影響的領域。

我們有第一方產品,比如 ChatGPT等,同時我們也提供開發者產品,每周有超過3億用戶使用 ChatGPT,還有300萬開發者在 API上構建各種應用。

無論我們如何努力通過自己的第一方產品去實現,我們所能影響的也只是 AI在全球範圍內能做的事情的一小部分。

這就是為什麼我們如此重視建立一個優秀的開發者計劃。無論我們是否涉足機器人領域,我們都希望確保其他在機器人領域做得很出色的公司也能使用我們的模型。

主持人

我想問一下關於合作夥伴關係的問題。OpenAI在某種程度上可以說是 AI領域的「瑞士」,與許多科技公司建立了合作關係,比如蘋果、微軟等。但這種中立性似乎不可能一直持續下去。在你作為產品負責人和推出產品的角色中,你如何看待與這些合作夥伴的合作?特別是,你們是否會繼續與蘋果合作?顯然,微軟也參與了新的Stargate項目,你如何看待這些多邊合作?

Kevin Weil

從產品的角度來看,我希望 ChatGPT能隨時隨地為你服務,只需一鍵即可訪問。如果你必須在手機上找到應用程式並打開它,那也沒問題,大多數應用程式都是這樣工作的。

但如果我們能讓它只需長按 iPhone側邊按鈕就能立即訪問ChatGPT,那就更好了,對吧?你會更頻繁地使用它,速度也會更快。我的意思是,你降低了使用 ChatGPT的門檻,它也能更多地幫助你。

這是我們與蘋果合作的重要組成部分,我們對此感到非常興奮。蘋果的智能功能還處於早期階段,甚至還沒有完全推出,在大多數國家都還沒有。

但想到只需長按就能在全球每部 iPhone上即時訪問 ChatGPT,這真是太棒了。

這也是為什麼我們在12天內推出了1-800 ChatGPT。我知道你們中很多人舉手表示使用過 ChatGPT。有多少人用過1-800 ChatGPT?聽說過一點嗎?看到舉手的人少了很多。

我們的想法是,如何讓每個人更容易訪問它?因此,我們擁有1-800 ChatGPT這個號碼,1-800-242-8478。

你可以把它存入聯繫人,然後在 WhatsApp上與它聊天,你可以問它任何問題,就像在 ChatGPT中一樣。雖然它在WhatsApp中無法提供那麼豐富的回覆,但它仍然可以做一些非常酷的事情。

突然間,任何擁有 WhatsApp的人,全球超過30億用戶,無論他們在哪個國家,都可以完全免費訪問ChatGPT,這是我們使命的重要組成部分。

這不僅僅是開發通用人工智慧(AGI),而是以改善人們生活的方式將其帶給大眾。我們通過 API實現這一點,這也是為什麼我們為有300萬開發者使用我們的 API構建出色的應用而感到自豪。

我們還希望通過我們的第一方產品將其帶給用戶,並將其免費集成到一個你可能每天使用100次的應用程式中,這是我們與蘋果合作的另一種方式。

主持人

我想問一下關於資金的問題。Sam Altman幾周前在推特上提到,OpenAI在每月200美元的訂閱服務上是虧損的。

Kevin Weil

我們在去年年底推出了一個專業計劃。我們發現的情況是,我們提供了免費的GPT,對吧?你甚至不需要登錄,只需訪問網站,無需帳戶就可以開始使用。如果你登錄了,你的使用限制會稍微放寬,但你仍然可以免費使用。

然後你還可以選擇 Plus計劃,每月支付20美元,你可以訪問更多功能,使用我們的一些更好的模型,等等。

我們看到的情況是,人們仍然在使用中遇到限制,他們希望使用的 AI和計算資源遠遠超過每月20美元的價值,因為這對他們來說非常有價值。

因此,我們希望找到一個方式,能夠基本上提供無限制的 ChatGPT使用。當然,這個「無限制」是有條件的,總是有一些限制,我們需要防止濫用等情況。

我們決定將這個計劃定價為每月200美元,因為我覺得很少有消費者計劃會這麼貴。但我們認為有很多人從 ChatGPT中獲得了巨大的價值,我們希望讓他們能夠儘可能多地使用它。

這就是為什麼我很高興看到有些人使用得如此頻繁,以至於他們每月的計算資源使用量實際上超過了200美元的價值。不過,我們在這個領域還處於早期階段,我們不可能永遠這樣經營下去。

但你還記得我說的成本正在迅速下降的事情吧?我們所做的一切都基於此。我們相信成本將繼續下降。我們的總體策略是嘗試提供更多的 AI服務。

如果你看看過去6到12個月的趨勢,我們降低了成本,提高了使用限制,提供了更多的免費服務,增加了 Plus計劃的內容,隨著時間的推移,我們也會在 Pro計劃中提供更多內容。

我們處在這個成本迅速下降、模型卻越來越智能的瘋狂世界中。我們希望讓更多人使用AI,因為我們認為這對世界是非常有益的。看到有人如此頻繁地使用 Pro計劃,真是太棒了。

主持人

我們已經討論了很多關於 AI的內容,但我想稍微談談 OpenAI的團隊。過去兩年是動盪的一年,而你剛剛加入。你六月份加入,之前在Meta和 Twitter工作過。你在這些公司工作期間也經歷了巨大的壓力,當時你正在為大眾開發產品,並試圖找到盈利的方式。我甚至昨天在 Axios上聽到你說,這個行業人來人往,但現在感覺特別動盪。你如何看待這個問題?你如何引導你的團隊留在 OpenAI並與你一起構建產品?

Kevin Weil

你知道關於這些處於高速增長階段的公司有趣的事情是什麼嗎?因為我在 Twitter早期和 Instagram時也感受到這一點,有時候媒體報導的內容——無意冒犯——其實在公司內部並沒有引起同樣的反響。

內部員工對這些事情的關注度並不像外界報導的那樣高。

然後你會看到所有這些外部文章,有時候情況恰恰相反,真正重要的事情並不總是被報導出來,你應該關注那些。

我很幸運能夠參與幾家高速增長的公司。我還沒有遇到過一家公司,在早期階段沒幾個關鍵人物、對公司的發展起到巨大作用。「天哪,我加入時公司只有20人,現在有200或2000人了,情況有點不同了,我準備好迎接新的挑戰了。」我認為這完全沒問題。

我們的工作是尊重他們,感謝他們所做的貢獻,同時招聘世界上最優秀的人才,繼續朝著使命前進。

這就是我們每天在做的事情。

主持人

但無論是內部還是外部,對 OpenAI從非營利研究實驗室轉變為營利性公司都有很多反對聲音。你的團隊正處於這一轉變的核心。你們正在開發這些新的營利性產品,雖然還沒有完全實現200美元計劃的目標,但假設你們做到了,你們是如何應對的?我的意思是,我不得不想像你的團隊在這方面也存在一些推拉和矛盾。

Kevin Weil

其實並沒有。這實際上是其中一個在外部討論得更多的問題,而在內部並沒有人為此感到焦慮,因為事情其實很簡單明了。

Sam已經多次提到,OpenAI最初是一個非營利組織,當時的想法是由一小群人逐步構建AGI(通用人工智慧)。順便說一下,當時沒有人相信這是可能的。所以有一群瘋狂的人試圖構建AGI,而其他人則覺得:「好吧,你們隨便折騰吧。」

然後,當他們真正開始取得突破時,比如 GPT-1和GPT-2,很明顯需要大量的資金和計算資源,這顯然與非營利模式不太相符。因此,為了維持公司的發展,最簡單的做法就是轉變模式。

記住,那時的 OpenAI還不是我們今天所認為的OpenAI。當時,這個小小的團隊感覺到他們看到了一些世界尚未意識到的東西,於是他們決定成立一個營利性實體作為公司的一部分,以便能夠接受資金支持,從而繼續推進使命。

現在公司已經發展壯大了,顯然我們已經成為一家更大的公司。現在人們覺得奇怪的是,這個非營利組織擁有一個越來越大的營利性實體。

其實,這個想法很簡單,就是誠實地面對現狀,嘗試進行重組。順便說一下,這種重組實際上保留了非營利性質。

這是我們使命中非常重要的一部分。我們認為在醫療、教育等領域,我們可以做很多有益的事情。目標是讓非營利組織在整個公司中擁有有意義的股份,並成為一個能夠在世界上做很多好事的實體。

主持人

我認為最大的恐懼是關於安全,對吧?OpenAI一直非常直言不諱地表示需要一些監管。在接下來的四年裡,您希望在監管方面看到哪些事情?

Kevin Weil

AI在與其他受監管行業接觸時已經受到監管,對吧?每當 AI與醫療領域交叉時,AI必須遵守醫療法規。每當 AI與法律領域交叉時,AI必須遵守法律規則。順便說一下,這是應該的。因此,AI已經在很多方面受到監管,就像任何在這些領域的產品、服務或實體一樣。

我們一直表示我們願意接受監管。我認為我們只需要監管,但不要意外地扼殺一個仍處於早期階段的新興行業。

主持人

昨天我採訪了 Anthropic的 Dario,他和你處於同樣的位置,他說,他認為到2027年,AI在大多數或所有事情上都會比人類做得更好。這是 OpenAI的立場嗎?這是你在實驗室中看到的情況嗎?這個問題的第二部分是,你對此感到興奮的是什麼?我們應該擔心什麼,是否需要躲到達沃斯的地堡里去?

Kevin Weil

是的,很難確定一個具體的日期。這是研究,這也是在 OpenAI或 Anthropic這樣的地方工作與我在其他地方工作的不同之處之一。我們公司有數百人從事研究,試圖揭示人類從未了解過的東西,這在很多方面都是學術風格的研究。因此,很難確定具體的時間。

我之前提到過,從排名第一百萬的程式設計師到排名第一千的程式設計師,再到排名第175的程式設計師,只用了三到四個月的時間。

我們正處於一個非常陡峭的發展軌跡上。

我甚至不確定是否會到2027年,我認為可能會更早。

至於我傾向於如何看待這個問題,我認為應對這一浪潮的最佳方式實際上是使用AI。如果你置身事外,閱讀大量文章,你可能會感到非常焦慮和害怕,但如果你真正使用它,你會發現它在日常生活中以這些方式幫助你,盡避它在某些方面還不完美。

你仍然可以感受到它在哪些方面變得更好,哪些方面還需要改進。然後你實際上就參與了未來10年將發生的變化。我認為這是正確的方式,因為這也意味著,最終無論是監管還是制定社會標準,都將由我們所有人來決定,對吧?

使用它的人們將決定這些事物應該如何發展。使用它的人越多,實際了解它的人就越多,我們在未來幾年經歷巨大變化時,得到的答案也會更好。

主持人

如果我們擊中 AGI。而人類並不真正需要做很多這項工作,你打算用你的空閒時間做什麼?聽說你會跑步?

Kevin Weil

我跑步,我騎自行車,我有三個瘋狂的孩子,很瘋狂。

Kevin Weil是業餘跑者

我不知道,我認為人們在生活中需要一個使命,我認為這不會因為 pre AI,post AI而改變什麼。我個人不是那種認為我們都會得到UBI(編者註:全民基本收入),就一直坐在那裡看書之類的人,我認為人們需要追求更宏大的東西。

所有這些變化,就像你回顧社會多年來經歷的任何重大變化一樣,其中許多變化是由於技術進步帶來的,總是有很多人預言災難,預言未來的厄運,比如汽車、收音機、電視、電力、印刷術,但人類是非常適應變化的。

我認為我們沒有人願意回到那些發明之前的日子。我們對 AI也會有同樣的感覺。它將改變世界,它已經在改變世界了,但我認為它將帶來積極的變化。我不認為當我們經歷這一切之後,我們會說:「我真的想回到過去,那時我不得不花一個小時填寫我孩子的足球報名表。」所以我對未來充滿期待。

主持人

好的,我要問最後一個問題。你曾為一些非常獨特的領導者工作過。你在 Twitter時為 Jack Dorsey工作,在 Meta時為 Mark Zuckerberg工作,現在為 Sam Altman工作,我本來想讓你給他們排個名。

Kevin Weil

哇噢。

主持人

要不來說一下,誰開的會議最好?

Kevin Weil

誰開的會議最好,我天呢。

主持人

這是一件非常人性化的事情,我們喜歡與人會面。

Kevin Weil

我覺得 Mark比 Sam更有條理,也比 Jack更有條理。Mark總是帶著一個假設而來,無論是什麼,他都會深入思考,Mark非常有野心,但他總是有一個從這兒到那兒的路線圖在腦海中。

我喜歡與他共事的一點是,他總是願意接受反饋。你可以說「我認為你錯了,原因如下」,但你最好準備好迎接隨之而來的辯論,因為他有他為什麼這樣想的理由,你可以說服他你是對的而他是錯的,但這需要你有充分的準備。

Sam更像一個遠見者。我認為 Sam是我見過的最優秀的人。人類通常不擅長指數思維,我們不太擅長從指數曲線中推斷出變化的速度。

Sam是我見過的最擅長這一點的人,他會說:「好吧,如果這真的是指數級的,那麼三年後,它不會是這種線性趨勢。」這是我們人類通常會犯的錯誤。實際上,它會達到這個水平。

這就是為什麼我們要建立一家公司,花費5000億美元構建 AI基礎設施。因為 Sam比我們其他人更擅長預測指數級變化,他看到了這些結果,並且正在做我們需要做的事情來為此做好準備。

責任編輯: 王和  來源:愛范兒 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2025/0126/2166020.html