新聞 > 國際財經 > 正文

從4年縮短至4個月!馬斯克速度嚇壞對手

作為全球首富,埃隆·馬斯克(Elon Musk)在極短的時間內,摒棄了企業構建數據中心的傳統方式,為他旗下人工智慧新興企業xAI部署了當前世界上規模最大、速度更快的超級計算機。此舉不僅令業界競爭對手深感震撼,同時也加劇了OpenAI微軟、谷歌等公司在超大規模數據中心領域的競爭態勢。

「巨像」在兩個方面驚呆對手

今年10月份一個陽光明媚的日子,一架螺旋槳飛機在美國田納西州孟菲斯市中心附近一座被翠綠草坪環繞的宏偉工業建築上空盤旋,機上的乘客紛紛記錄下該設施的影像資料。

此次飛行實則是一次秘密偵察行動。馬斯克近期將這棟原本是家用電器製造工廠改造成了數據中心,內部有世界上規模最大的伺服器集群,專門用於人工智慧模型的訓練。馬斯克為xAI打造的人工智慧超級計算機,其建設速度之快,在OpenAI等競爭對手的高層中引發了廣泛的憂慮與不解。

據看過這些照片的知情人士透露,機上乘客來自一家與馬斯克數據中心構成競爭關係的企業,他們試圖深入了解這個被嚴密防護的數據中心的營運細節。這些知情者還觀察到,馬斯克利用卡車運送了多台燃氣渦輪機至現場,為設施提供電力支持,並努力探尋xAI如何高效管理建築內伺服器散熱的解決方案。

孟菲斯上空的偵察飛行,凸顯了科技領域最燒錢競賽中的一場高風險較量。微軟、Meta、谷歌和亞馬遜等科技巨頭都在競相投資新建數據中心,以支持ChatGPT等人工智慧技術。

這是一個冒險的豪賭,它基於一個簡單的信念:伺服器集群的規模越大,其訓練出來的人工智慧表現就越出色。2022年末,OpenAI推出的聊天機器人ChatGPT風靡全球,不僅在科技行業掀起軒然大波,也加劇了各方對超大規模伺服器集群的激烈爭奪。

作為OpenAI的聯合創始人及早期資助者(儘管後來分道揚鑣),馬斯克在數據中心競賽的序幕剛剛拉開之時便已加入戰局。憑藉非凡的雄心壯志、不懈的努力以及對傳統數據中心建設常規的挑戰,他成功地在業界掀起了軒然大波。

馬斯克的超級計算機「巨像」(Colossus)在兩個方面令競爭對手瞠目結舌:其龐大的規模以及xAI驚人的建造速度。這台超級計算機配備了10萬顆GPU,它是訓練和運行人工智慧軟體的理想選擇,其規模遠超Meta等科技巨頭以往打造的類似超級計算機。

四年建設周期縮短至122天

將如此龐大的GPU集群整合到一台超級計算機中絕非易事,因為伺服器需要消耗巨額的電力,且連接晶片的網絡設備也面臨著嚴重的頻寬瓶頸。xAI如此迅速地完成這一項目,實屬前所未聞。

馬斯克與為「巨像」提供GPU的人工智慧晶片領軍企業英偉達共同宣布,該數據中心與超級計算機僅耗時122天便宣告竣工。在最近的播客訪談中,英偉達執行長黃仁勛坦言,如此規模的GPU集群往往需要三年的規劃與設計周期,再加上一年的建設時間方能投入使用。

談及「巨像」項目時,黃仁勛在播客中感慨道:「毋庸置疑,現在大家都輾轉難眠了!據我所知,全球唯有馬斯克一人具備這樣的能力,他對工程、建築、大型系統構建以及資源調配的獨到見解,堪稱舉世無雙。」

馬斯克之所以能在孟菲斯迅速建成數據中心,部分歸因於他省略了幾個關鍵步驟。例如,他在尚未從電網獲取足夠電力以運行「巨像」的情況下便啟動了建設。然而,這種打破常規的做法正是馬斯克在多家公司屢試不爽的策略之一。

例如,在特斯拉,馬斯克曾在一個停車場為Model3汽車搭建了一條生產線,從而繞過了在加州擴建汽車廠所需的繁瑣許可流程。在SpaceX,他不斷催促工程師精簡火箭上他認為不必要的部件,或採用非太空專用設計的更廉價部件。

儘管xAI的人工智慧工具目前仍顯著落後於OpenAI,但馬斯克建造超級計算機的速度已引起了OpenAI執行長山姆·奧特曼(Sam Altman)的高度警覺。據內部消息透露,在馬斯克於X平台發帖後,奧特曼與微軟的基礎設施高層發生了爭執,他表達了對xAI發展速度可能超越微軟的擔憂。

奧特曼還憂慮xAI可能會迅速擁有比OpenAI更強大的超級計算機。這一擔憂促使OpenAI首次考慮尋求微軟以外的合作方案。目前,一個備選方案正在德克薩斯州阿比林(Abilene)的一片荒蕪平地上緊鑼密鼓地建設中,有些公司正為即將落成的數據中心做前期準備,該中心預計明年將為OpenAI部署10萬顆晶片。

現場施工進展異常迅速。在最近的一次現場探訪中,一位項目承包商透露,多數建築尚未砌牆。承包商正在場外預製該設施的大部分組件,以便到場後迅速組裝。

或許不久的將來,即便是阿比林和孟菲斯的超級計算機也會顯得相對渺小。包括微軟在內的一些科技巨頭已著手討論建設規模更為龐大的數據中心項目,這些項目將包含數百萬個GPU,每個項目的成本預計超過1000億美元。

這一趨勢極可能持續發酵,因為數據中心行業的幾乎所有參與者都在密切關注競爭對手的每一步動向。

「數據中心市場相對狹小,每個人都緊盯著行業內的一舉一動,」DPR Construction高級數據中心團隊的負責人約翰·阿塞洛(John Arcello)表示。DPR Construction曾為Meta等大型企業建造數據中心,目前正參與阿比林的項目建設。

建設「計算超級工廠」

今年早些時候,馬斯克開始著手整合創建xAI所需的龐大算力。xAI是他在2023年創立的一家公司,迅速成為人工智慧領域的強勁對手。當時,馬斯克已向甲骨文租用GPU,用於訓練xAI的大語言模型Grok的初始版本。

為了進一步提升Grok的性能,馬斯克亟需擴充算力資源。今年5月,他通過視頻連線與潛在的xAI投資者進行了交流,作為籌集數十億美元資金的前期鋪墊。據一位參會投資者透露,馬斯克在會上描繪了一幅打造全球最大超級計算機的願景,他將其命名為「計算超級工廠」,就像特斯拉在全球布局的龐大生產基地一樣。

馬斯克與xAI不足12人的團隊圍坐一桌,詳細闡述了他的計劃:將10萬顆英偉達H100(當時市場上最尖端的GPU)集成至一個超級計算機集群中。屏幕上展示的一張圖表清晰地顯示,xAI建造超級計算機的速度將是大多數企業的五倍之快。該公司正以「令人難以置信的速度」全速前進,並鄭重承諾:「馬斯克將親自監督數據中心的如期交付。」

馬斯克向投資者透露,他尚未就是否與雲端運算服務提供商合作,還是獨立推進該項目做出最終決定。

數周后,甲骨文的多位高層管理人員與馬斯克舉行了視訊會議,共同探討第一種合作方案。據知情人士透露,馬斯克向甲骨文提議,由甲骨文為xAI打造超級計算機,此舉將使這家人工智慧初創企業一躍成為甲骨文的重要客戶之一。

馬斯克原本寄望於將xAI數據中心設籍於孟菲斯的Electrolux前工廠遺址,並期待在2024年秋季順利竣工。然而,據與會者透露,在一次電話會議中,甲骨文的高管向馬斯克坦言,他們難以按照馬斯克所期望的速度完成建設任務。

據知情人士透露,甲骨文高管指出,馬斯克所選中的大樓電力供應不足,無法滿足他計劃安裝的晶片數量所需的能源。馬斯克很快就對甲骨文高管的反對意見感到失望與沮喪。最終,他決定讓xAI拋開甲骨文,獨立開發孟菲斯數據中心。

馬斯克在社交媒體上寫道:「甲骨文無疑是一家偉大的公司……但是,當我們的命運取決於成為迄今為止最快的公司時,我們必須親自掌舵,而非僅僅作為乘客坐在後座!」

打破常規,採用臨時供電計劃

為了能在預期時間內完工,馬斯克催促孟菲斯當地官員以前所未有的速度批准這個建設項目。而孟菲斯方面也表現得頗為急切,渴望滿足馬斯克的需求,以便能吸引他的業務,為這座城市帶來發展機遇。

大孟菲斯商會主席泰德·湯森(Ted Townsend)在接受訪問時表示:「我們不分晝夜加班加點地工作,隨時都在接收簡訊和電話,力求展現出與xAI及其期望相匹配的幹勁和效率。」

今年6月初,湯森公開宣布,馬斯克已經選定了孟菲斯作為xAI超級計算機的設籍地。緊接著的幾個星期里,馬斯克和他xAI的團隊迅速拆除了孟菲斯的舊工廠,為放置英偉達GPU的機架騰出了大片空間,並開始安裝各種電氣、機械和管道設備,並為伺服器部署了先進的水冷系統。

然而,在這種飛快的施工進度中,電力供應卻成為了一個不小的障礙。起初,孟菲斯的這座工廠所提供的電力根本無法滿足xAI所有高能耗GPU的需求。通常情況下,這類問題很可能會讓數據中心項目的進度脫軌或是延期。

但馬斯克總能想出巧妙的應對之策:在等待地方當局批准他提出的在現場增加100兆瓦電力的請求期間,他引入了移動天然氣渦輪機來作為臨時的電力補充。而田納西河谷管理局也在上周通過了他的這一請求。

但馬斯克的這一舉動很快就引發了當地環保組織的強烈反對。他們向當地的衛生部門致信,指責xAI在未經許可的情況下擅自運行天然氣渦輪機,對空氣造成了嚴重的污染。一位在微軟數據中心工作的高管也表示,考慮到微軟在氣候方面所設定的目標和倡議,該公司絕不可能做出類似的事情來。

南方環境法中心的高級律師阿曼達·加西亞(Amanda Garcia)對田納西河谷管理局的決定表示反對,她表示:「使用天然氣渦輪機,就像是在未獲得批准的情況下偷偷建造違規發電廠,這著實令人震驚。畢竟,空氣污染已經是孟菲斯西南部面臨的一個巨大挑戰。」

然而,馬斯克能夠迅速完成這個項目,背後或許還有其他一些助力因素。數據中心業務的高管們透露,在xAI開始使用這一超級計算機集群之前,「巨像」超算很可能無需經過任何合規性測試。這主要是因為xAI計劃將這台超級計算機專用於自身需求,而非出租給其他客戶。

相比之下,微軟在將伺服器移交給OpenAI或其他Azure雲客戶之前,必須經過多次數據安全測試。這些客戶通常希望伺服器能達到一定的正常運行時間或隱私標準。

數據中心營運商DataBank的執行長勞爾·馬丁內克(Raul Martynek)表示:「我們必須通過所有這些不同的行業認證。我可以肯定地說,xAI數據中心目前還無法通過這些認證。」

馬斯克打造「巨像」超算的努力確實遭到了不少質疑。多位數據中心高管認為,將製造工廠等建築改造為適用於GPU伺服器和液體冷卻系統的設施極其困難。據兩名與xAI員工交談過的人士透露,在過去幾個月里,該設施的改造多次中斷。

但這些問題似乎並未拖慢xAI的腳步。馬斯克和英偉達表示,在首個伺服器機架進入數據中心僅僅19天後,他們就已經開始了下一代Grok模型的首次訓練。

在最近的一次訪談中,馬斯克的密友、他旗下多家公司的長期投資者安東尼奧·格拉西斯(Antonio Gracias)透露,xAI正在重新思考構建數據中心的整個流程,「我們從最基本的原則出發,努力使其更經濟、更高效、更快捷。」

格拉西斯繼續說道:「我在特斯拉、SpaceX等公司都看到過這種情況。在這些公司里,馬斯克是領航者,同時也有幾十名工程師在他的帶領下,共同致力於創造出儘可能最優、最有效的系統。」

其他科技巨頭緊緊追趕

今年夏天,隨著馬斯克在超級計算機領域取得顯著進展的消息逐漸傳開,亞馬遜、微軟和谷歌這些巨頭的數據中心高管們紛紛致電英偉達,詢問同一個問題:馬斯克是如何在超級計算機項目上取得如此神速進展的?

據與這些公司有過交流的人士透露,不僅如此,包括Meta在內的其他一些公司的高管們還聯繫了一家小型雲提供商,探詢這些公司是否能以比他們自己建設數據中心更快的速度為他們提供所需的容量。

隨著有關孟菲斯數據中心的信息不斷被披露,這些公司對於揭開該項目成功奧秘的渴望愈發強烈。數據中心和雲端運算業務的管理人員們對該設施的圖像進行了仔細研究,試圖從中收集到關於其設計的任何信息。

馬斯克在社交媒體平台X上發布了幾張數據中心內部的照片,進一步滿足了公眾的好奇心。上個月,一位行業分析師在參觀了「巨像」所在設施後,還在YouTube上發布了一段視頻。

與此同時,在與xAI的談判於今年夏天破裂之後,甲骨文迅速與OpenAI達成了提供計算能力的協議。據悉,新的OpenAI數據中心將設籍阿比林,為此,甲骨文已經與創業公司Crusoe和Lancium共同簽署了一項開發協議。

上個月,Crusoe成功籌集了超過30億美元的資金,用於推進數據中心的初期建設。這個數據中心將配備10萬顆英偉達即將推出的新型GPU,即GB200。

與馬斯克在孟菲斯的項目一樣,Crusoe也在全力推動項目的快速完成。DPR公司的阿塞洛承擔了該項目的建設工作,並表示這是他參與過的建設速度最快的項目之一。兩家公司從3月份開始討論數據中心的設計方案,到了6月份就已經破土動工。

幾個星期前,阿比林的工地上,建築工人們正緊鑼密鼓地砍伐樹木,為新電站騰出空間,並且每天都在儘可能地加快混凝土澆築工作。據三名知情人士透露,為了確保能夠按時向現場供電,OpenAI已經要求項目合作夥伴考慮使用天然氣渦輪機作為備用方案。

在最近的一次現場參觀中,當被問及為何數據中心的快速建設會引起如此大的關注時,一位承包商回答道:「誰能更快地製造出自己的超級計算機,誰就幾乎可以統治世界!」

責任編輯: 王和  來源:騰訊科技 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2024/1117/2131253.html