新聞 > 科教 > 正文

瘋搶AI晶片:機房拆舊貨,一片賣10萬

01、像賣愛馬仕一樣賣晶片

今年以來,大模型和AI2.0既是最火熱的創富夢,也越來越成為一個昂貴的「權力的遊戲」。在技術、資本、人才等構建出的種種門檻中,還有一張重要的入場門票——你有沒有「門路」能搞到足夠的英偉達高端顯卡。

王非是華東地區一家伺服器定製企業的銷售部經理,他向「市界」描述了最近英偉達顯卡的緊俏程度:「需求太火爆,有些人從機房裡把晶片禁運政策生效前購買的A10080GB拆出來倒賣。」這些舊晶片不只沒有保固,相比於去年8月前後8萬多元的單價,價格還漲到了10萬多元。

即便已經舊貨拆賣、物盡其用,顯卡的供應還是嚴重不足。「需要拿現款去,對方才願意賣給你。」而相對顯存較小、訓練效率低的A10040GB即便有全新的,也乏人問津。「詢價的多,成交的少。」

具體而言,這批搶手的顯卡指的是英偉達旗下的「Tesla」系列產品。在訓練AI大模型時,比傳統CPU更高效的GPU(圖形處理器,又稱顯示晶片),尤其是高端GPU一芯難求。

2020年和2022年,英偉達先後推出了A100晶片、H100晶片,其中A100顯卡又提供80GB、40GB兩個顯存版本,H100則提供80GB顯存。顯存越大,所能運行的神經網絡也就越大。

2022年9月開始,美國禁止英偉達等向中國出口高端GPU晶片。為應對禁運政策,英偉達又在2022年和2023年分別推出了特供中國版的顯卡A800和H800。

不過如今,在政策允許範圍內的A800晶片,在市場上也出現了供貨周期拉長、價格上浮的現象。王非透露:「在大模型火爆之前,A800大概兩周即可到貨。但現在我跟客戶保守估計要在8周內,即便是最樂觀的情況,也需要4-6周。」

供職於北京一家顯卡分銷企業的郭麗婕對「市界」表示:現在公司的A800單卡報價為8.75萬元,已經超出了A800在2022年11月時8萬-8.5萬元的價格區間。而且,8.75萬元只是實時報價,顯卡還有繼續漲價的趨勢。「我告訴客戶確定要了再找我聊,現在的庫存也不多。」

另一家位於深圳的顯卡供應商,則給A800開出了8.95萬元的報價——更高的溢價意味著等待時間較短,需要大約兩周的貨期。

作為算力基礎設施,競購英偉達高端顯卡晶片已經成了一種「搶跑遊戲」。而決定AI創業公司成敗的要素之一,「就是你到底有沒有能力調動最起碼100張以上的英偉達顯卡。」一家AI創業公司負責人對「市界」講到。

他透露:「在去年8月之前,通過國內正規渠道,還能買到A100顯卡,也可以採購海外版A100。在此之後,國內A100被切斷了貨源,從海外採購海關也不會放行。」

不過那些允許被特供中國的A800和H800晶片對於緊缺算力的AI中小公司而言,同樣是遙不可及。

王非透露:「一般來說英偉達的貨先到國內總代,再被我們這類廠家分走,銷售給做AIGC項目的客戶。目前H800雖然已經發售,預計單卡售價會在20萬起,也沒有進入我們這一級市場。現在能拿到H800的,應該只有阿里雲、騰訊雲這種有資格從英偉達原廠直接採購的大廠商。」

在市場緊俏的背景下,H800等高端晶片已經提前被大廠包攬。目前,國內僅有騰訊雲官宣「用上」了H800。4月14日,騰訊雲發布了基於H800的大規模算力集群,並將其定義為H800的「全國首發」。

據《晚點 LatePost》了解,字節今年向英偉達訂購了超過10億美元的 GPU,僅字節一家公司今年的訂單可能已接近英偉達去年在中國銷售的商用 GPU總和。大公司的合作方式主要是和英偉達原廠直接談採購,能否搶到卡,更多是看商業關係,比如以往是不是英偉達的大客戶。

而在龐大的需求面前,據傳英偉達甚至開始學起了愛馬仕,在購買搶手的 GPU時,也需購買其它產品作為取得優先供應權的「配貨」。

在這場大模型研發競速賽中,相比超級大廠,更多小玩家只能先把名字寫進等待名單。而無論哪一方歷經蕩滌、最終勝出,作為算力供應者的英偉達都能穩拿訂單,笑到最後。

02、黃仁勛的運氣有多好?

在商界一直有一種說法:當淘金者蜂擁而至時,獲得財富就變成了小概率事件。最後掙到錢的,更可能是站在淘金者身邊「賣鏟子」的人。

一位科技賽道的投資人對「市界」回憶:在前幾年的AI行業資本寒冬中,「泡沫破滅時,投資人和企業突然意識到,(算法創業)成本極高,都是在虧錢,反而讓上游(電視劇)賺錢了。」

而在AI這個近年來最大的科技風口面前,英偉達便是那個第一批站在上游、得以幸運「起飛」的公司。

在今年5月舉辦的英偉達業績電話會上,英偉達創始人、總裁兼CEO黃仁勛直言:今年1月以來出現的新產品需求「不可思議地陡峭」,公司訂單「多到難以置信」。

不僅市場對英偉達產品瘋狂競逐,資本也展現出了慷慨的態度。5月30日,英偉達成為全球首家市值突破萬億美元的晶片設計商。

當有記者向黃仁勛提問:「(在新一輪AI浪潮中)英偉達獲得的豐厚回報是因為運氣,還是因為有先見之明?」黃仁勛並不諱言英偉達人氣暴漲的「運氣」成分:「我們只是相信總有一天會有新的東西發生,其餘的需要一些偶然性。」

如今已經無人在意,短短一年之前,英偉達還陷在營收不及預期、股價滑坡的漩渦之中。如果沒有AIGC的「天降神力」,看上去這將是一個已發生過無數次的「商業先行者」遺憾折戟的故事。

過去數年間,英偉達的高端顯卡更多被用於PC遊戲和虛擬貨幣「挖礦」之上。疫情之下,受益於消費電子需求暴增,英偉達股價也隨之連番上漲。2021年,英偉達股價最高升至300多美元,創歷史高點。

但進入到了後疫情時代,隨著遊戲市場遇冷,疊加虛擬貨幣持續波動,2023財年的前三個季度中,英偉達營收連續下滑,淨利潤大幅縮水。與之相應的,公司股價在2022年8月,跌至了年內最低的每股108美元。與2021年高點相比,市值僅餘三分之一。

不過,到了2022年底,隨著ChatGPT橫空出世,英偉達一舉扭轉頹勢,成為了被全球追捧的明星。截至6月23日美股收盤,英偉達股價已升至422.90美元。

在英偉達一飛沖天的同時,人們開始追溯,這是否是一個關於決策者「深謀遠慮」的故事。而黃仁勛本人對此的定義是:「這不是先見之明。先見之明是加速計算。」

因為在某種程度上,用GPU訓練AI模型的歷史正是由英偉達開啟的。

2010年,據媒體報導,英偉達首席科學家兼高級研究副總裁Bill Dally與其好友、全球AI領域權威學者吳恩達某天在咖啡店裡共進早餐。彼時,吳恩達正在谷歌進行AI研究,但在推進課題過程中遇到了算力不足問題。

如果想要補上吳恩達團隊面臨的算力缺口,谷歌需要新購置約1.6萬塊CPU(中央處理單元)。以英特爾在2010年發布的伺服器CPU產品至強X5680為例,後者當年的單價約為1666美元,1.6萬塊合計需要約2700萬美元。

這筆預算足夠讓吳恩達的研究胎死腹中。據數據分析機構「PitchBook」調研,2010年全球AI和機器學習領域獲得的風險投資還不足5億美元。

Bill Dally聽說了吳恩達的煩惱後,建議他用英偉達的GPU替代CPU來進行AI訓練。由於CPU採用串行計算方式,更擅長邏輯控制,但數據處理效率較低。而英偉達的GPU產品採用了其自研的並行計算架構「CUDA」,能夠將任務分解成若干部分同時解決。最終,吳恩達團隊果然僅用48塊GPU並聯,就解決了問題。

在此之後,越來越多的研究團隊開始將英偉達晶片用於AI訓練使用。而黃仁勛也在看到AI市場的巨大機遇後,從2012年開始,將AI列為了重要的發展方向。

某種程度上,在10年前AI落地應用還是模糊一片的背景下,便在深度學習層面開始布局,確實代表了黃仁勛的「先見之明」。

就職於矽谷某AI晶片獨角獸公司的Lee對「市界」講到:對晶片企業而言,在2012年投入深度學習的計算是一個非常難得的選擇。據他回憶:「2012年是大數據時代的巔峰,最賺錢的市場是網際網路資料庫、文件系統等等,做深度學習可以說是』冷板凳』。而且英偉達是圍繞著深度學習的主題進行全方位、點點滴滴的下注,包括完善語言設計、開發者工具等周邊軟體工具。」

03、國產GPU奮力追趕

對於英偉達的成功原因,黃仁勛曾這樣總結:「我們很早地,大約在10年前就發現,(AI)這種製作軟體的方式可以改變一切。我們從底層一直到頂層,從各個角度改變了公司。」

從2016年開始,英偉達旗下的加速計算GPU產品線(代號「Tesla」)開始專門針對AI訓練任務進行設計。這一年推出的晶片型號為P100,同時配備有英偉達新研發的高速互聯技術「NVLink」。而NVLink能夠允許CPU、GPU晶片間進行高速交互,進一步提升了運算效率。

從底層到頂層搭建起的軟硬體產品生態,也是英偉達在這輪AI風口,因其長期布局和最大的確定性,得以受到資本熱捧的原因。但從市場、技術等角度考慮,英偉達當下構建的「算力帝國」也還遠遠談不上固若金湯。

根據2023財年財報顯示,中國是英偉達的第一大目標市場,英偉達在中國市場實現的營收占其全球市場營收的47%。而在政策限制下,英偉達難以向中國市場銷售A100、H100高端晶片,無疑將對其營收造成重擊。

黃仁勛個人,從不掩飾對於中國市場的期望。5月底他在接受《金融時報》採訪時,抱怨美國政府對於半導體技術的出口限制使得英偉達束手束腳,警告持續升級的中美晶片戰將令美國科技業面臨遭受「巨大損害」的風險。「如果失去了中國市場,我們並沒有應急計劃。因為世界上沒有其他中國,中國只有一個。」

但在英偉達高端顯卡出口受阻的態勢下,許多中國客戶不得不轉向其他選擇。而細細數來,市場中英偉達的挑戰者並不少。

王非告訴「市界」:「我一些做AIGC項目的客戶選擇了海光的國產顯卡DCU Z100L。據我所知,海光的產品目前已經用到了多個國產大模型里。」

另一位大模型應用層的創業者則透露,由於買不到A800,其所在的團隊緊急購置了一批英偉達的消費級顯卡GeForce RTX4090,「未來會考慮其他選擇,或者更多配置雲端運算資源」。

在供應端,天數智芯、摩爾線程等國產GPU廠商已經開始積極推動產品落地於大模型訓練領域。

6月10日,天數智芯對外宣布,經過驗證,其研發的國內首款量產的通用GPU「天垓100」具備支持百億級參數大模型訓練的能力。據稱,在天垓100加速卡的算力集群支持下,北京智源研究院70億參數的「Aquila」語言基礎模型完成了參數優化工作。6月上旬,摩爾線程則宣布其已經完成對智源研究院「悟道·天鷹」大模型的推理兼容適配,整個適配過程僅花費不到6小時時間。

除了國產GPU玩家,「AI晶片第一股」寒武紀、阿里巴巴旗下晶片企業「平頭哥」的產品同樣可以用於運行AI相關任務。

6月19日,「國產CPU第一股」龍芯中科在投資者交流平台公開表示,其已完成通用GPU相關IP設計,預計第一個集成自研通用GPU核心的SOC晶片(系統級晶片)計劃於2024年Q1流片,在此基礎上將研製兼顧顯卡和計算加速卡功能的通用GPU晶片,計劃於2024年下半年流片。

伺服器廠商南京坤前計算機的一位客戶經理總結道,在AIGC等大模型應用領域中,國產產品已經可以部分滿足客戶需求。他講道:「不僅是現在,在未來的一段時間內英偉達GPU供不應求也是可預見的,但我認為不必過於追求英偉達。只要算力集群足夠大,國產卡也夠用,就算國產卡頻寬少一點,運算的時間多一點,起碼可以實現自主。」

此外,從6月上旬開始,市場便不斷傳出知名資管機構與大股東對英偉達的減持計劃。實際上,英偉達「算力帝國」的縫隙也已經開始顯現。

6月6日,背後站著老牌歐洲金融世家羅斯柴爾德家族、管理資產近900億美元的愛德蒙得洛希爾資產管理公司透露,已經將部分英偉達頭寸獲利了結。主要原因是:AI估值太高,越來越不確定。如果估值繼續上漲,機構會變得謹慎。知名投資估值專家Aswath Damodaran也表示,賣掉了英偉達的股票,因為「這輪上漲太驚人」。

事實上,黃仁勛自己便可能是矽谷最具危機感的企業家,他曾多次公開提到:「我一直認為我們距離倒閉只有30天的時間。」最近,他也在採訪中表達了擔心:認為在英偉達因政策而「缺席」的這段時間,中國的GPU初創企業會很快追趕上來。

責任編輯: 夏雨荷  來源:市界 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2023/0627/1919549.html