新聞 > 國際財經 > 正文

字節 阿里 百度 為這塊晶片搶破了頭

需求似乎是無限的,但英偉達的代工廠台積電產能有限,除了大廠之間的爭奪,美國對中國的晶片封鎖也讓國內的大廠更難買到A100這樣的高端晶片。包括A800、H100、H800,A100和它的「繼承者們」,遭到各方的哄搶,價格水漲船高,最瘋狂的時候,在短短一周里,一台由8張A800組成的伺服器,可以從230萬漲價到330萬。有段時間,孫文博感到疑惑:怎麼好像在炒比特幣?

一個賭局

一個賭局在伺服器銷售的圈子裡悄悄傳開:香港新到的300台8卡A100伺服器,總貨值近8個億,到底會花落誰手?

關於這個賭局,有層層的迷霧——買家都有誰?不清楚,但有消息說,貨是2023年10月的第三個周五進的香港,來自拼多多和金山的採購團隊為了這個消息,連夜抵達,嚴陣以待;貨從哪裡來的?不知道,據說是一家手段高明的公司,通過英偉達的非授權渠道拿到;具體定價多少?沒有準確數字,追蹤著這個消息的伺服器廠商高管孫文博說:「話語權在賣方,肯定會為這批貨篩選到價格最高、現金最多、交易條件最好、未來有望繼續合作的買方。」

A100,一個頗具科幻氣息的名字,容易讓人聯想到《終結者》中的機器人代號。實際上,這是一種GPU晶片,採用7nm製程,製造它的光刻機,需要在大約萬分之一根頭髮絲細的空間裡進行精細的雕刻。在大約826平方毫米——不到一張3cm*3cm便簽紙大的面積里,容納了足足540億個電晶體。它的設計公司英偉達,用科學家的名字來命名產品,A來自電磁學科學家安培(Ampere),而A100的前代產品V100,來自電池的發明者伏特(Volta)。

與每台電腦中都有的中央處理器(CPU)不同,GPU似乎離普通人有點遠,它在電腦中的另一個名字是顯卡,負責圖像處理、視頻渲染,熱衷打遊戲的年輕人,會為一塊高性能顯卡省吃儉用,而GPU的另一個主要場景是「挖礦」,單枚價值數萬美元的比特幣,就是GPU晝夜不停運作的產物。

如果說CPU是一個數學系畢業的高材生,能計算各種艱深複雜的問題,GPU就像是匯集了一萬個只會1+1=2的小學生,能以最快的速度處理海量簡單重複的問題,而這正是訓練人工智慧最需要的能力,通過對龐大數據的學習、分析、推理,讓機器像人類那樣解決問題。學習的數據越多,機器越聰明,但處理海量數據需要強大的晶片,A100正是為此而生,它靠著超強算力,被譽為「GPU中的王者」 「一片頂六片」。

在美國科技公司OpenAI推出的大語言模型ChatGPT驚艷了全世界之後,國內的網際網路公司、大模型創業公司都大步快跑,衝進這個最有前景的賽道,百度、阿里、科大訊飛、360等網際網路大廠,和不少初創企業,都抓緊推出自家的大模型,轟轟烈烈的「百模大戰」徹底打響。

大模型之爭的關鍵在於算力和數據,理論上說,只要GPU數量足夠多(例如有10000台伺服器),一家公司甚至可以在極短的時間之內訓練出一個不遜色於ChatGPT 4的大模型,而A100就是挖掘大模型金礦時最鋒利的那把鏟子。除了大模型,各類人工智慧公司,包括計算機視覺、語音交互、智能駕駛等,都需要這把鏟子。

需求似乎是無限的,但英偉達的代工廠台積電產能有限,除了大廠之間的爭奪,美國對中國的晶片封鎖也讓國內的大廠更難買到A100這樣的高端晶片。包括A800、H100、H800,A100和它的「繼承者們」,遭到各方的哄搶,價格水漲船高,最瘋狂的時候,在短短一周里,一台由8張A800組成的伺服器,可以從230萬漲價到330萬。有段時間,孫文博感到疑惑:怎麼好像在炒比特幣?

在無限的需求、有限的供給和時間當中,流轉著巨額的錢和掘金者們的冀望,考驗著大廠和創業公司們的嗅覺、財力、戰略和決策效率。全新的排位賽中,有個體的命運沉浮,也有企業的野心、欲望和爭奪。

就像那個賭局,儘管還不知道結果,但行內人都估量,拼多多做電商的,業務跟大模型無關,也沒有傳出做大模型的消息,但AI時代,先下注總比錯過好。就算不做大模型,轉售出去,或是做算力租賃,也是穩賺不賠的好生意。至於金山,雖然自家的WPS AI也需要算力晶片,但估計吃不下這麼大的單子,財力也稍遜一籌。

曖昧不明的交易,以及謠言、猜測、賭局,都成了大模型和A100瘋狂的註腳。

燒錢遊戲

王子鵬第一次感到風暴襲來,是在2023年的5月。

來自美團的高管帶著採購團隊,把他供職的伺服器廠商——寶德資訊科技有限公司庫存里僅剩的數百台8卡A100伺服器,像買白菜一樣全部掃走。儘管一台機器的價格要大幾十萬,總訂單額過億,美團的人絲毫沒有猶豫,下單、簽合同、打預付款、提貨……流程飛快。

事實上,在專業的領域裡,A100從來不是什麼稀罕事物。大模型的風颳起來之前,A100等算力晶片的購買者大多是國內大型的實驗室,例如鵬程實驗室、智源實驗室、之江實驗室、中科院的計算所,曾經購買過上百台伺服器。除此之外,還有一些人工智慧相關業務的公司,比如抖音瘋狂增長的那幾年,為了訓練AI進行內容審核,也曾找寶德訂購了不少V100伺服器,「一年買兩個多億」。

作為曾經的伺服器銷冠、如今的高管,王子鵬自稱是「戰場最前端戰壕里的瞭望員」,行業里每個細微的變化,都是銷售們最先知道。但那一次,他和同事都看走了眼,以「相當低的價格」出售,「就是平進平出走個量,掙一個點、兩個點」。這讓公司的高層日後都懊悔不已,覺得做了「賠本生意」。

2023年3月14日,OpenAI發布GPT-4,以此為時間點,大模型賽道突然湧進來大量的錢、公司、採購團隊,曾經並不緊俏的A100,突然成了搶手貨。而就在2022年的10月,美國商務部對高性能晶片作出額外出口限制,禁止美國公司向中國實體出售高端晶片,A100正在其中。政策是政策,生意是生意,英偉達轉而推出了A100的中國特供版——A800,王子鵬打了個比方,與A100相比,A800「就像是把汽車的輸油管改細了一點,發動機和輪胎還是原來的東西」。

最初,所有人都追逐最好的東西——市場裡有限的A100。需求暴漲,2022年10月之前,「就是一個正常的市場」,到了2023年的5月,「至少得是以前50倍以上的需求量」。美團掃貨之後的短短几個月,A100和8卡A100伺服器的價格水漲船高,漲到了13-16萬/張和135-160萬/台左右,這意味著,以前5個億能買下來的東西,現在要10個億。

昂貴的價格讓這場晶片爭奪戰變成了燒錢戰。價格就是這麼漲上去的:在賣方市場裡,一批貨沒有準確的買家,誰出的錢多,就歸誰。還有一種情況,廠商簽下了訂單,寧可付違約金,只交付50%,也要把剩下的貨用更高的價格賣出去。

眾多買家裡,字節是業內公認投入最多的那個。有知情人士透露,字節內部採購了大約13600張A100,按照一張卡7萬元的最低價格計算,光這些晶片就價值9.52億。

一家大廠在內部資料中估算,目前字節擁有20多萬張算力晶片,其中約10萬張是A100/A800/H800等高算力晶片。這些晶片當中,有一小部分對外出租,未被出租的高算力晶片則被用於字節大模型的訓練和推理,還有一些其他型號被用於支持公司內部業務推理場景,比如興趣電商、抖音搜索、抖音廣告排序等。

等市面上僅剩的A100被哄搶得差不多了,對A800的需求逐漸成了主流。此時,更多的大廠和創業公司入局了,比如拼多多,在2023年的下半年組建了大模型團隊,招兵買馬,開出了百萬年薪挖角人才。對算力的需求就像一個越吹越大的氣球,A800的價格達到了比A100更高的高度——在2023年10月,一台8卡A800伺服器的價格達到了220-230萬左右。

雙重考驗

A100和A800的瘋狂,是市場需求和政策禁令雙重疊加,催生出的極致供需矛盾的體現。而在漲價和禁令的夾縫之中,大廠和創業公司們也面臨著雙重考驗。

第一重考驗是嗅覺和戰略決策能力。

本身就探索人工智慧前沿技術的阿里達摩院、科大訊飛、百度和商湯科技等公司,長期跟算力晶片打交道,是最早布局、嗅覺也最敏銳的公司。王子鵬和孫文博都曾得到過消息,字節和阿里是最先向英偉達下單的,「都下了近一萬張卡的訂單」。百度後來之所以最早推出文心一言,也是因為提前採購了算力晶片。

由於涉及大量的錢,事關公司未來發展,大模型項目以及採購算力晶片等事項,大多是公司最高層來決策。一位阿里雲人士透露,阿里雲內部有一個供應鏈團隊,其中有幾十人負責晶片採購,直接聽命於CTO。而在阿里雲前CEO張勇卸任之前,通義千問等人工智慧項目由他親自盯進度。

據《晚點》報導,在百度開始文心一言內測前,百度創始人兼CEO李彥宏每晚和項目團隊開會,他們為籌備產品,一度睡在公司里;而即便已經卸任CEO,張一鳴也在看人工智慧論文,經常跟一些字節人士分享論文學習心得和對 ChatGPT的思考。一把手們的重視,讓這些公司在這場比賽中占了先機,省下了數以億計的成本。

而「A100們」設下的第二層考驗,是公司內部的溝通和執行能力。

正如一個「打地鼠遊戲」,2022年英偉達推出了A100的特供版A800,但2023年10月23日,這款晶片也被列入了禁售列表。跟它一起被禁售的,還有H100的特供版H800,只給中國公司留下了30天的應對時間。

王子鵬記得,在2023年的10月,A800、H100等產品的訂單都已經排到了一年後,有英偉達的銷售告訴他,公司會斷掉一些老產品、低性能產品的供應,把產能都集中到高性能算力晶片上,但即便如此,產能還是不夠。這意味著,從英偉達拿貨已經不太現實。

市場變化得極快,產品、價格、貨期隨時變化,那些決策不夠快的大廠,會在此時暴露出問題。

孫文博與京東的採購打過交道。京東供應鏈體系有上千人,專門採購算力晶片的團隊有近20人,負責人直接向VP匯報。他們不關心配置、技術,認準了產品型號直接談價格,這是他們最關心的三個問題之一,另外兩個是交貨期和具體的交貨條件,比如預付款占比、違約條款等。

孫文博還記得京東採購團隊的猶豫,「他們一直在追著市場走」。10月上旬,A800還有貨,價格在220-230萬左右,採購團隊向高層匯報後,始終沒有得到具體的答覆,沒有「是」,也沒有「否」。直到需求漲起來了,才提出以250萬的價格購入1000台伺服器,但這時,市場上的價格已經高達320萬。

猶豫和觀望是有成本的,可能是幾千萬,也可能是幾個億。孫文博覺得無奈,「勸他們買的時候他們不買,要等價格下跌,結果等到的是上漲」。

後來,孫文博觀察到,隨著A100、A800價格的高漲,京東的決策周期在變快,從前把情況報給高層沒有反饋,「知道了,但很久不決策」,如今,「兩三天基本上會給你一個結果,因為超過兩天沒有決策,基本上這批貨就沒了」。

賣鏟子和水的人

2024年,曾經風光的大廠們,年會要麼取消,要麼低調舉辦。沉默的網際網路世界,只有英偉達還熱鬧著。CEO黃仁勛首次參加英偉達中國區的年會,他穿著一身東北大花馬甲,笑容燦爛,跟員工一起扭起了秧歌。那股熱鬧喜慶,也是英偉達這一年的寫照。

大模型狂奔、算力晶片被爭奪,英偉達成了最大的贏家。假如說大模型創業公司和網際網路大廠們在人工智慧的世界裡掘金,那英偉達就是賣水和鏟子的人,市值在一年多時間裡暴漲6倍,前幾日甚至超過了亞馬遜和谷歌,以1.83萬億美元的市值位居全球第四。

在國內,有兩種方式可以購買英偉達的產品,一種是通過英偉達的合作夥伴網絡內的代理商單獨購買GPU卡,例如英邁,神碼、麗台;另一種是找到英偉達的OEM整機合作夥伴,直接購買含有英偉達GPU的伺服器整機,例如浪潮信息、寶德信息。

假如是前一種方式,根據36Kr的報導,2023年上半年,高算力晶片要像愛馬仕一樣,配貨才能購買,阿里、字節這樣財力雄厚、訂單量大的大廠,可能會優先供貨。

假如是後者,王子鵬說,英偉達對於渠道管理非常嚴格,根據銷售額給渠道劃分級別,連續兩年達標才可以申請升級,否則就會下降。不同級別拿到的產品價格又是不一樣的,級別越高,作為中間商的利潤空間就越大。

巨頭之下,有不少人在跟著吃肉喝湯,在大模型真正賺到錢之前,這些賣鏟子的分銷人和中間商早已賺得盆滿缽滿。

王子鵬曾經跟浪潮的高層交流,「浪潮60%的業績是網際網路一個行業撐起來的」。有一次,王子鵬接到一個浪潮轉過來的訂單,對方銷售稱,某營運商有30台8卡A100需求,公司沒有貨,「要不轉給你們做?」王子鵬一臉疑惑:「你們公司怎麼可能沒有貨,全中國囤貨最多,銷量最大,怎麼連營運商都敢得罪。」結果對方說,浪潮的貨都優先供給網際網路公司了。

儘管不是最大的伺服器廠商,寶德也在風口中賺了一筆。直到今天,王子鵬依然覺得不可思議,原來一年才賣十幾二十台,碰見大項目可能走個三五十台,現在大量的詢價、訂單流向自己,一張口就是20台、30台,「我們當時都驚呆了,20台、30台這個訂單就是2000萬、3000萬」,這樣的單子,每天都有好幾個。

當A100們被幾家大廠瓜分,大廠也搖身一變,成為算力租賃商,爭做大模型掘金熱潮中的賣水人。最典型的是阿里和字節。

前阿里雲員工楊簫透露,阿里的戰略特殊,不靠大模型賺錢,靠的是生態。已經發布並開源的通義千問就像一個樣品屋,誰都可以使用阿里的代碼,讓自己的大模型跑起來,然後來阿里租賃算力。「阿里的大模型是一個帶動性的東西,真正賺錢的是賣『水』。」

在阿里,一台8卡的伺服器算力一個月的租賃價格在15萬-20萬左右,至少4台起賣,這意味著,一台機器只要租出去8個月就可以收回成本。

字節的火山雲也像阿里雲一樣在賣算力,楊簫說:「區別在於,字節純賣水,阿里在賣水的基礎上,還賣服務,一整套解決方案賣給你。」正因如此,阿里的算力價格比字節更貴。

現在,阿里和字節在這門生意上已經成了對頭,雙方互相探聽對方算力晶片的數量、價格。在阿里雲,可能只有CEO吳泳銘、CTO周靖人這樣級別的高管才知道自己公司一共囤了多少張晶片,但大家都聽說過字節囤了多少張。價格戰也打響了。字節的火山雲銷售會詢問客戶,「阿里跟你們要多少錢?我們六折」。

創業大模型公司作為融資最多、現金流豐裕的客戶,是雙方爭搶的關鍵。李開復的零一萬物和王慧文退出的光年之外,選擇了阿里;而在海外名聲更大的Minimax,行業內看好的智譜AI,主要使用字節火山雲的算力。

2023年也是智能駕駛競爭激烈、開城落地的關鍵之年,對算力晶片也有龐大的需求。智駕公司元戎啟行,曾是阿里雲智算業務的客戶。新勢力中的蔚小理,紛紛成立了智算中心,蔚來的在合肥,小鵬在烏蘭察布,都跟阿里合作,理想的在山西,跟火山引擎合作。不過,到了買算力的檔口,還是要看哪家性價比更高、更適合自己。一位阿里雲人士透露,蔚來曾經在阿里「跑過一個小集群和demo」,但最終還是選了更便宜的字節。

當算力的儲備遠遠供不上需求,阿里雲智算業務也像英偉達和浪潮一樣,調整了客戶策略。「內部有一個客戶評級體系,起碼到6-7級以上,也就是訂單金額在千萬以上,才有成為阿里雲智算業務客戶的機會。」

風口裡的人

2022年8月底,美國的晶片禁令下來,A100、H100名列其中。那個月,王子鵬手裡剛好有一個項目,機器預計在禁售的前一天抵達香港海關。但到了第二天,那台機器沒能進來,英偉達給公司退了款——也就是那台機器的訂購價格,近百萬。沒多久,這台機器的價格就漲到了他不敢相信的數字。

市場裡的漲幅,是以十萬、百萬為單位的。孫文博記得,在10月25號左右,一台H800伺服器在國內現貨市場的成交價格是220萬-230萬一台,一周後,11月2日,美國出了最新的政策,伺服器的價格從220萬直接漲了100萬,達到了320萬。到了11月,價格還在漲,最高報到了385萬。

市場瘋狂的上漲讓一夜暴富的故事批量上演。

有人看準了時機,在伺服器90萬的時候囤貨,等漲到110萬再賣出去,也有人膽子夠大,可以等到120萬甚至220萬的時候再賣。王子鵬總結,「風浪越大,魚越貴」。孫文博說:「最瘋的時候有多少瘋?比如你手裡有個三五台,因為各種原因沒有賣掉,放在那,10天時間,資產就漲了50%。」

據36Kr報導,2023年底,英偉達中國區的銷售都聯繫不上,因為這一年太賺錢,紛紛出國度假了。一家叫聲智科技的公司,本來是做電動牙刷和智能家電的,不知道為什麼囤了一大批A100,算力租賃做得風生水起。

也有很多唏噓和感慨。在80台8卡A100伺服器以很低的價格被美團掃貨之後,寶德的高層領導幡然醒悟,王子鵬記得,「一直在罵銷售,說你把我這個東西賤賣,讓公司少賺了大幾百萬純利潤」。

每隔一段時間,這件事就要被老闆重新提起來一次,成為督促銷售們「看準時機」的反面案例,「說為什麼這波這大模型沒有抓住,為什麼沒有賺到錢」。或者是,「你這個事情給我干好,要不然又像大模型一樣錯失機會」。

騙局、貪腐也出現了。有人在小紅書上倒賣A100、A800等晶片。一位自稱手裡有A100現貨的中間商聲稱,從2023年的3月開始,陸續有人找到他詢問有沒有貨,半年時間,他賣出去大約十幾片。

王子鵬認為,在社交平台上聲稱自己有貨源的,很可能是假貨源,也有可能是40g的庫存貨,因為記憶體不夠大,這些A100通常被當做作訓練大模型的第二或者第三梯隊用卡,大家哄搶的是80g記憶體的算力晶片。還有一種可能,是網際網路大廠中隱秘的貪腐:「網際網路可能有很多個數據中心,拆出來賣掉也是有可能的,那麼多的卡,回頭跟公司報修一下,就說是壞了,也能糊弄過去。」

熱情、失落、疲憊、震撼,這個行業以一種前所未有的姿態衝擊著人們。孫文博說,作為銷售,他承擔著所有的情緒——伺服器漲價,客戶的氣撒在他身上;貨供不上,老闆的焦慮也傳遞到他這裡來,他的神經高度緊繃著,2023年一整年,他的電話24小時待機,不管是誰打來電話,他都會在第一時間接聽。

經歷了良多,王子鵬依然覺得,這是時代給他的機會。2020年時,他向客戶介紹A100,需要把它的歷史淵源、性能優勢從頭到尾講個清楚,而整個公司,一年才賣十幾台伺服器。到了2023年下半年,每次他開口給客戶介紹產品,對方會給他一個「我懂」的眼神,談話直接進入下一階段,「沒想到三年以後,我這套專業的說辭變成人盡皆知」。他意識到,那個鼓點,他踩中了。

風口還是風險?

晶片是一個典型的全球化產品。一塊晶片,可能由英偉達設計,使用荷蘭阿斯麥公司(ASML)的光刻機生產,在台灣的台積電封裝,而每一個環節又涉及到更多的國家、企業。

因此,晶片行業與其他行業最大的不同在於,美元匯率、國際形勢甚至自然災害,都會影響到一塊晶片的成本、價格和供需關係,而這其中蘊藏著巨大的風險。

一位浪潮的中層銷售王初告訴每日人物,在美國發布新規、繼續加碼,英偉達A100、A800、H100、H800都被禁售的10月底,公司亂成了一鍋粥。「我們按照訂單金額20%收定金,光定金就收了30個億,倒推回去,150個億的單子,供不上。」

缺卡態勢嚴重,王初的一位同事,一個單子8個億,只供了40多台機器,還有7億多供不上。公司一到貨一批貨,就會被哄搶,不知道該分給哪些部門、哪些客戶。有的客戶已經不願意再排隊等待,撤單的消息一個個傳過來。

王初長嘆了一聲,「浪潮今年好不容易有個新的增長點,是英偉達最大的合作夥伴,所以我們拿到的卡是最多的,拿到的訂單是最多的,但現在卡一禁售,對我們影響也非常大」。

處於危機中的還有一些算力租賃公司。他們簽下了大量訂單,卻無力供給,孫文博說:「有個公司董事長說自己,現在在外面已經簽了10個億的合同,結果1個億的貨都沒有,每天早上一醒來一屁股的債。」

最大的贏家英偉達,也吃了苦頭。黃仁勛曾透露,中國市場占英偉達銷售額的大約20%,而美國阻止英偉達向中國銷售最先進晶片,如同將「雙手綁在背後」。

在國內,國產晶片已經瞄準了這塊新空出來的市場,比如華為推出了Atlas 800 AI訓練伺服器,其中包含8片昇騰處理器。古希臘神話里,Atlas是擎天之神,因為反抗宙斯失敗,被罰在世界最西處,用頭和手撐住天空。這個名字寄託了華為的願望,也暗示著華為的處境。

但有業內人士評價:「華為的生態比英偉達差一些,生態的切換是一個龐大且複雜的工程,大家用英偉達的卡和生態太久了,切換起來很困難。」

對算力的信仰,建立在對人工智慧的篤定之上,但現在,大模型的亂戰,帶來的不只有金錢、欲望和爭鬥,還有一些迷茫。

某211高校信息工程學院副教授趙佳有一種被擠壓的感覺:「所有大廠都在做大模型,不知道自己該做什麼。」在這場風颳起來之前,他做的是一些「小模型」,藉助少量的算力去實現一些現實中的工程目標,比如在南方沒有人煙的地方,不再需要工人去一個個檢查電線是否完好,而是換成載著人工智慧程序的無人機去「巡線」,判斷電線上有沒有冰,絕緣子有沒有裂縫,精準定位後再報修。但因為算力伺服器價格的暴漲,他的項目預算不夠了,只停留在了「小模型」的階段,沒辦法進一步深入。

他對當下數量龐大的大模型感到不理解,「有這麼多大語言模型,然後呢?」在他看來,許多大模型產品更多是一種噱頭,沒有實際的用處,花掉那麼多的錢、資源、算力,幾乎是浪費。

在幾年前一次人工智慧相關的學術會議中,剛入行的王子鵬偶遇一位北大藥學院的老教授,他有點疑惑,藥學教授怎麼來參加人工智慧會議?對方回答,人工智慧可以在很多領域裡帶來革命性的改變,包括製藥。那是一種關於可能性的戰爭,找到符合標準的化合物並不容易,可能在各個環節遭遇失敗,一款新藥上市可能需要花掉10年、10億美元。但人工智慧可以在各個流程上替人類計算、預測、篩選,最大程度地縮短時間、節省成本。

王子鵬「被刷新了認知」,原來,AI真的可以改變世界。但幾年過去了,他發覺,目前被改變的好像只有商業的世界,那個錢和欲望流動的地方。而對大模型的狂熱和對算力的追捧,到底能走到哪一步,誰也沒有答案。

責任編輯: 李冬琪  來源:每日人物 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2024/0218/2019454.html