新聞 > 科教 > 正文

馬斯克發布Grok3聊天機器人,號稱性能勝過DeepSeek和ChatGPT

2月18日消息,埃隆·馬斯克旗下的人工智慧初創公司xAI發布最新版Grok3聊天機器人,同OpenAIDeepSeek等大模型展開新一輪競爭。他將Grok3描述為「地球上最聰明的人工智慧」,並通過基準測試和圖表展示了這款聊天機器人的強大推理能力。

馬斯克表示,Grok3首先面向 X的 Premium Plus訂閱用戶開放,他們將作為首批體驗者。此外,xAI還為忠實粉絲推出了名為 Super Grok的獨立訂閱服務,提供最先進的功能和最早的新特性訪問權限。

xAI表示,Grok3的預訓練已經完成,整個團隊一直在積極地將推理能力整合到當前的Grok3模型中。然而,這種集成仍處於早期階段,需要更多的改進。Grok3目前正在繼續接受訓練。

除了Grok3推理模型外,xAI還在訓練一個該推理模型的迷你版。可以將Grok3的推理數據與迷你推理模型進行對比,有時其後者的表現甚至會略微優於Grok3推理模型。

號稱性能超越DeepSeek和ChatGPT

在發布會上,馬斯克表示,xAI之所以將其聊天機器人命名為 Grok,是因為這個詞源自美國科幻作家羅伯特·海因萊因的小說《異鄉異客》(Stranger in a Strange Land)。在書中,「Grok」由一位在火星上長大的角色使用,意指對某事物全面且深刻的理解。

馬斯克和他的人工智慧團隊聲稱,Grok3測試版的推理能力超過了現有的人工智慧模型。在有關推理和測試時間的基準測試中,Grok3取得了比DeepSeek-R1、OpenAIo1、OpenAI o3 mini- high、Gemini-2 Flash Thinking更優的效果。

美國AIME2025數學競賽

xAI的比較基準顯示,Grok3在科學、編碼和數學方面的得分高於Gemini2 Pro、Deepseek V3、ChatGPT4o等。

並且,在盲測方面,xAI的 Grok-3(早期版本)在 lmArena排行榜中以1402分的歷史最高成績登頂,成為首個突破1400分的AI模型。這一成績超越了 Google、OpenAI、DeepSeek等業界主要競品。

122天打造AI超算中心,使其性能翻倍

在演示過程中,馬斯克和xAI的幾位高管分享了他們是如何構建Grok。馬斯克透露,由於xAI希望儘快推出Grok3,時間非常緊迫。因此,他們意識到必須在短短四個月內建成數據中心。

因此,xAI花了122天讓首批10萬顆GPU上線並運行。這是目前全球最大的全連接H100集群。隨後,xAI進一步加速擴建數據中心,僅用92天便完成第二階段建設,使計算能力再次翻倍。

xAI團隊還展示了Grok3如何執行有趣的任務。例如計算從地球到火星的太空飛行器任務。Grok3生成了一張太空發射的動畫3D軌跡圖(即從地球到火星然後再返回地球的可行軌跡)。這涉及一些複雜的物理知識,Grok3需要理解這些內容。

Grok3還展示了在自動化遊戲開發方面的潛力。

xAI團隊要求 Grok3現場創造一款融合《俄羅斯方塊》和《寶石迷陣》的新遊戲。Grok3生成的Python腳本定義了遊戲的常量、顏色、方塊形狀等元素,並呈現出獨特玩法:當連接了至少三個相同顏色的方塊時,會觸發重力機制使方塊消除,這種方式類似《寶石迷陣》。

此外,Grok3包含一個名為Big Brain的功能,這是一個推理模型模式,允許在處理查詢時進行更深入的思考。馬斯克指出,17個月前,最初的Grok模型幾乎不能解決高中問題,而現在它已經進步了很多,他幽默地比喻「Grok已經準備好上大學了」。

開發深度搜索功能、考慮開源Grok2

除了推出 Grok3之外,xAI還透露,該公司正在籌建一家人工智慧遊戲工作室,該工作室將專注於為消費者提供服務。

此外,xAI正在為 Grok開發深度搜索功能(DeepSearch)。這將成為其 AI智能體的核心能力之一。DeepSearch是一款推理聊天機器人,能夠闡述其理解查詢內容的過程以及規劃回復的方式。演示顯示,DeepSearch具有研究、腦力激盪和數據分析等功能。馬斯克團隊還表示,他們打算「儘快」推出一款基於語音的聊天機器人。

對於Grok3是否會開源,馬斯克表示,「我們通常會在新模型發布的時候,開源上一代模型,所以幾個月後,我們也會對Grok2進行開源。」

結語

隨著Grok-3不斷刷新紀錄,人工智慧競賽正加速升溫。xAI通過強化推理能力、構建超大算力集群,並在遊戲等應用領域進行實驗性探索,正快速躋身DeepSeek、ChatGPT等頭部大模型的競爭行列。

Grok-3的持續疊代表明,AI競賽不僅未見終點,反而正在進入更激烈的階段。

責任編輯: 李華  來源:騰訊科技 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2025/0218/2177429.html