、
近日,美國人工智慧數據基礎公司Scale AI創始人兼執行長Alexandr Wang在接受CNBC採訪時稱,DeepSeek擁有大約五萬塊英偉達H100晶片,但因美國出口管制措施,他們不能公開談論。
當被問及中美兩國在人工智慧領域的競爭時,王表示:「長期以來,美國一直處於領先地位。」不過,他補充說,DeepSeek最新的模型確實試圖改變這一局面。王認為,「中國實驗室在聖誕節發布一款驚天動地的模型具有象徵意義,要知道,我們其他人正在慶祝節日。」

Alexandr Wang(王)CNBC
DeepSeek於2024年12月26日(美國時間12月25日)當天發布了一款DeepSeek-V3,隨後又於1月20日推出了一款專注於推理的強大AI模型DeepSeek-R1,對標OpenAI的o1模型。
DeepSeek宣稱利用較少且不夠先進的晶片訓練出了媲美ChatGPT的模型。DeepSeek在一份技術報告中稱,它使用超過2000個英偉達H800晶片集群來訓練其參數為6710億的V3模型,而Meta訓練參數量4050億的Llama3,用了16384塊更強的H100顯卡,花了54天。Deepseek的訓練效率為Meta的11倍。
DeepSeek宣稱,訓練其最新模型之一的成本為560萬美元(約合人民幣4100萬元)。相比之下,人工智慧開發商Anthropic的執行長達里奧·阿莫迪(Dario Amodei)去年提到的建立一個模型的成本為1億至10億美元。
王對此不僅不信還披露,「中國的實驗室擁有的H100晶片比人們想像的要多得多。」他補充道,「據我了解,DeepSeek擁有大約五萬塊H100晶片。」王認為,因為違反了美國實施的出口管制,所以DeepSeek不能談論這些。
英偉達的Hopper架構GPU如H100和H200,因其優秀的算力,出口受到美國政府的管制。拜登政府於2022年通過一項規定禁止英偉達向中國出售性能遠超其舊款GPU A100的GPU系列,迫使英偉達開發了名為H800和A800的性能削減版晶片用以替代,但一年後的2023年10月,這兩款晶片也一併被禁止。目前,英偉達已在推廣其最新一代Blackwell架構的GPU,其出口依然受到限制。
王將中美之間的人工智慧競賽描述為一場「AI戰爭」,並補充道,「美國將需要大量的計算能力和基礎設施,我們需要釋放美國的能量以推動這場AI繁榮。」


















