新聞 > 科教 > 正文

LeCun怒揭機器人最大騙局 瞬間引爆了戰火

  

一場公開演講,LeCun毫不留情揭穿真相:所謂的機器人行業,離真正的智能還遠著呢!這番話像一枚深水炸彈,瞬間引爆了戰火,特斯拉、Figure高管紛紛在線回懟。

人形機器人,也成為了AI圈最大的騙局?

最近在MIT的一場講座中,Meta首席AI科學家LeCun一語道破了機器人界最大的秘密——

這些公司壓根不知道,如何讓機器人變得足夠「聰明」,或是說達到通用智能的程度。  

家用機器人的實現,還需要AI領域取得一系列突破。

機器人在工廠里擰螺絲、搬貨等,可通過特定任務訓練實現,但讓它們在家中疊衣服、倒水、理解人的意圖,還很難。

他將這種差距,比作「窄智能」和「通用智能」的鴻溝。

而突破的核心,在於打造一款真正可以規劃的「世界模型」架構,即能夠學習理解和預測物理世界系統。

誰曾想,LeCun這番話再次捅了「馬蜂窩」,直接給這場狂熱潑了一盆冷水,引機器人界大佬上陣怒噴。

特斯拉Optimus AI負責人Julian Ibarz直言,我不同意LeCun的觀點。

在內部,特斯拉對於如何快速實現通用人形機器人,已經有了非常明確的思路。

Figure創始人Brett Adcock直接喊話,「誰去和LeCun說一聲,讓他別端著了,親自下場干點實事吧」!



Yann LeCun:LLM只是記憶力好,智商還不如貓

Yann LeCun一直領先於時代的主流認知,但好像每次都是對的。

在1987年,他在現在的索邦大學(Sorbonne)獲得博士學位,論文英文標題是《Connectionist Learning Models》「連接主義學習模型」。

論文的核心是建立了神經網絡中反向傳播算法的理論基礎。

而在當時,大多數人還在研究專家系統。

他怎麼想到這個研究方向的?這又如何影響了他以後的職業發展?

在MIT演講中,Yann LeCun回顧了他如何踏上人工智慧研究之路。

上大學時,他有點偶然地發現,原來早在50-60年代,包括1981年諾獎得主David H. Hubel和Torsten N. Wiesel等人,就已經開始思考「自組織」的問題——也就是系統如何自我組織學習。

這一方向後來催生了「機器可以學習」的早期想法。

他覺得這個想法特別迷人,而且當時他「初生牛犢不怕虎」——

我一直認為,生物學給工程提供了很多靈感。在自然界中,所有活著的東西都有適應能力,只要有神經系統就能學習。  

所以,我當時想,也許我們人類沒那麼聰明,構建智能系統最靠譜的方法,可能是讓它自己學會變聰明。

也許,正是這種「愣頭青」的心態讓他走上了機器學習這條路。

他坦言,當時「機器學習」不是AI研究的主流。

由於當時幾乎無人從事相關研究,他一度難以找到博士導師。

之後,他與Geoffrey Hinton合作,隨後進入貝爾實驗室Bell Labs與紐約大學NYU任職。

人工智慧領域在1990至2000年代經歷「寒冬」,但2013年LeCun加入Facebook,創立FAIR(Facebook AI Research),並推動「深度學習」這一術語取代「神經網絡」,標誌著產業界開始系統性地接受這一範式。

2018年,因在概念與工程領域的突破性貢獻,他讓深度神經網絡成為計算技術的關鍵組成部分,和Bengio、Hinton共享圖靈獎。

順便提一句,Yann LeCun訪問清華大學時,確定了自己的中文名「楊立昆」。

但這次,Yann LeCun直言:「LLM就是一條死胡同,世界模型才是正道」。

他指出,文本屬於「低頻寬」數據源,「僅靠文本訓練永遠無法實現人類水平智能」。真正的智能來源於高頻寬的感知輸入——視覺、聽覺、觸覺等多模態經驗,而非低維度的離散符號。

他將大語言模型訓練所需的數萬億標記詞元,與兒童處理的海量感官數據進行對比:

四歲兒童通過視覺接收的數據量,已相當於所有公開文本訓練的最大規模LLM的數據量。

他進一步指出,LLM有時雖能提供實用的結果,甚至讓人誤以為其「智商堪比博士」,但這些系統只是「回憶」訓練中的信息。

LeCun指出,大語言模型(LLM)存在本質瓶頸——雖然形式上通過「學習」取代了顯式編碼,但仍依賴人類知識的間接轉移。

LLM不具備任何真實意義上的智能——甚至不如一隻貓。

他強調,即便貓的大腦僅含約2.8億個神經元,其對物理世界的理解與行動規劃能力仍遠超當前AI系統。

貓能感知三維空間、判斷物體穩定性、規劃複雜動作,而目前的所有生成式模型恰恰無法企及這些能力。

因此,他真正關注的問題是:如何讓機器學會物理世界的模型?

有點腦子的人,不再用LLM

世界模型,已成為LeCun的代名詞。

對談中,他再次給「世界模型」下了一個定義——

給到一個時刻t的世界狀態,再給定一個智能體可能的動作,預測動作執行後的環境。

就好比,讓一個機器人沖一杯咖啡,它需要想像一系列動作——拿起杯子、倒水、攪拌,並預測每一步的結果。

一旦系統配備了這樣的世界模型,就可以進行規劃:

設想一系列連續的動作,並利用模型預測這些動作所導致的結果。

同時,系統可結合一個「代價函數」(cost function),用於評估特定任務的完成情況。

在此基礎上,可運用優化方法,搜索能夠優化任務目標的最優動作序列,這一過程即為「規劃與最優控制」。

LeCun稱,團隊所採用的「環境動力學模型」完全通過自監督學習的,也是當前方法的核心所在。

實驗已證明,可以用世界狀態的表示——來自現有模型DINO,無論是從零開始學習,還是基於V-JEPA 2等框架,都可以做到這一點。

機器人不用針對特定任務反覆訓練,只需從模擬數據或真實操作中學習「動作-結果」的關係,就能零樣本完成新任務。

這種訓練完全是自監督的。

當系統有足夠好的世界模型,便能「想像」如何完成一個它從未被訓練過的任務。

這一概念,在2016 NeurIPS大會主題演講中,LeCun早已向世界傳輸——

世界模型,會成為未來AI系統的關鍵組件。

LeCun預測,「未來3-5年內,這會成為AI架構的主流模型」。

這話可讓我在矽谷得罪了不少人,包括某些巨頭公司。  

到那時候,但凡頭腦清醒的人,都不會再用現在這種生成式LLM的路子了。

主持緊接著問道,所以這能推動機器人技術,讓未來這十年真正成為機器人的時代?

LeCun直言不諱,過去幾年,打造「類人機器人」的初創公司如雨後春筍般湧現。

但行業的一大秘密是——它們還不知道如何讓機器人真正「聰明」到實用級別。

所以很多估值數十億公司的未來,基本上取決於是否能在「世界模型+規劃」的架構上取得顯著進展。

LeCun越說越激動,觀點顯然有些「生猛」。

主持人一聽,馬上話鋒一轉打了個圓場,「沒關係,我們不擔心那些公司。而且說真的,我們非常信奉創業精神」。

產業界在行動:機器人的世界模型

Yann LeCun的「冷靜」,與多位行業領袖所鼓吹的激進時間表形成了鮮明對比。

Figure AI表現得尤為激進,其CEO Brett Adcock近期宣稱:

明年就能實現通過語音指令,讓人形機器人在陌生環境(比如從未進入的家庭)完成各類通用工作。

這位創始人解釋稱,其信心源自公司對軟體與智能難題的攻關。

人形機器人擁有40個自由度(關節),可能產生的位姿組合數量甚至超過宇宙原子總數。

Brett Adcock強調「這個問題無法通過編程解決,唯一途徑是神經網絡」。

他將Figure的技術路徑與同行對比,直言某些公開演示只是「戲劇表演」或預設程序。相反,Figure機器人的所有操作都「由神經網絡驅動」。

 

 

耐人尋味的是,在一個關鍵問題上的判斷與Yann LeCun不謀而合:他也否認製造業是主要突破方向,並指出「人形機器人當前的競爭焦點在於誰能攻克通用機器人技術」。

雙方的核心分歧似乎在於——這個目標離我們究竟有多近。

與此同時,特斯拉正從另一個角度攻克難題。

馬斯克始終聚焦「極其艱巨」的製造挑戰,指出人形機器人規模量產「所需的供應鏈尚不存在」。

據報導,特斯拉正在建設年產百萬台Optimus機器人的生產線,目標在2026年初推出具備「量產意向」的V3原型機。

然而專注製造並不意味特斯拉忽視AI難題。

在最近的計算機視覺頂會ICCV,特斯拉AI負責人Ashok Elluswamy詳細介紹了公司的「神經世界模擬器」——一個通過車隊視頻數據訓練的端到端系統。

不同於傳統模型根據狀態預測動作,神經世界模擬器能夠基於當前狀態與後續動作,直接合成未來狀態。

這種機制使得模擬器可與智能體或策略AI模型形成閉環連接,從而實現對系統性能的精準評估。

Elluswamy確認,這套被視作世界模型問題直接解決方案的架構,將「無縫遷移」至Optimus機器人。

Yann LeCun的論斷看似否定了整個人形機器人領域,但已有企業公開將其研發方向與他倡導的「世界模型」概念對齊。

獲得OpenAI投資的挪威公司1X Technologies,近期發布了自研「世界模型」。

傳送門:https://www.1x.tech/1x-world-model.pdf

如圖所示,1X世界模型包含視覺編碼器、動作編碼器、核心網絡,以及視頻與狀態價值解碼器。通過對成功標籤進行監督學習生成的狀態價值預測,可對輸入動作的質量進行量化評估。

1X世界模型的獨特優勢在於:允許從相同初始條件出發,並行部署不同策略進行直接對比。

1X團隊在現實部署方面的審慎態度與LeCun不謀而合。

 

 

 

 

執行長Bernt Børnich在播客中坦言,讓機器人進入家庭存在「理想與現實的落差」,指出「現實環境複雜得離譜」,甚至「Wi-Fi連接問題比機器人技術本身更棘手」。

這種務實立場,結合其輕量級肌腱驅動設計所帶來的安全性優勢,暗示著行業清醒認識到:Yann LeCun所說的「突破性進展」仍需要持續探索。

Yann LeCun的警告,最終重新定義了人形機器人競賽的維度:勝利者,或許不屬於推出最炫酷demo或設定最激進量產目標的廠商,而將屬於那個率先攻克機器理解物理世界這一根本性難題的探索者。

彩蛋:Llama與我無瓜

全程半小時演講中,還有一個大彩蛋。

Meta血裁AI部門研究員掀全網風暴之外,LeCun卻一直對外撇清自己和Llama的關係。

幾天前,他曾表示,自己並未參與任何Llama項目。

這一次,LeCun在演講中再一次強調,「我並沒從技術層面上,參與Llama的項目」。

搞笑的是,主持人前一句還在夸「Llama的誕生讓世界AI民主化」,話音還沒落,LeCun就在旁邊急著插話——

我要坦白!

接著,他分享了幕後故事,「第一代Llama,其實有一點像『海盜』項目(pirate project),與官方LLM並行開發」。

大概2022年中後期,巴黎一個十來人的小組,決定做一個輕量高效的LLM,結果真做出來了。

沒想到,它後來成為了「主力選手」。

最後,在2023年初,小紮下定決心組建了一個GenAI團隊,也就如今的「超級智能實驗室」(MSL)的前身,主要就是為了把它產品化。

但在技術上,我個人確實沒怎麼插手。

 

 

 

 


LeCun最後再一次重複——Llama與我無瓜,就差把它寫在臉上了。

現場,主持人再次圓話,「但最後能跑出來的,往往還是『臭鼬工廠』(Skunk Works)這種模式」。參考資料:

https://www.humanoidsdaily.com/feed/meta-ai-chief-yann-lecun-claims-humanoid-firms-lack-path-to-general-ai https://

 

 

https://x.com/humanoidsdaily/status/1981623685459972487

阿波羅網責任編輯:時方

來源:新智元

轉載請註明作者、出處並保持完整。

家在美國 放眼世界 魂系中華
Copyright © 2006 - 2025 by Aboluowang

免翻牆 免翻牆連結