新聞 > 軍政 > 正文

Deepseek迅速冒起 深度調查曝光背後三大關鍵

Deepseek(「深度求索」)突破冒起,除了獲政府支持,本台再發現,亦靠「三大招數」,包括在香港集資、在晶片禁令「空窗期」囤貨、以及利用美國免費開放AI資源等;而且是百度、商湯、華為等中國巨擘在制裁下仍急速發展的關鍵。另值得留意的是,今次與2023年一樣,每當美國發布制裁時,中國便會高調推出「驚世」產品,聲稱能無懼制裁併超越美國。有台灣國防和美國智庫學者向本台分析指,中國這「三招」已發展成熟,能抗衡美國,亦能在宣傳戰上建立強者形象。

在美國嚴厲制裁下,中國竟在兩年內誕生可媲美ChatGPT的「國產」AI DeepSeek,而且其開發及訓練成本僅為其他大模型的不足5%,及僅用2千塊英偉達(NVIDIA)晶片就可建成。本台深入發現,總結出「速成」背後三大關鍵。

DeepSeek成功之道一:在美國AI研發數據上「加工」

第一,在美國AI研發數據上「加工」。本台取得DeepSeek所屬公司「北京深度求索人工智慧基礎技術研究有限公司」的一份專利說明書。當中就「人工智慧模型訓練資料集的建構方法」指出,具體實施時「需要建構用於大語言模型訓練的資料集」,「數據的來源可以使用現有數據集,例如各種開源資料集,也可以是從自行取得的資料」,之後整理一套模型,可「在不增加額外的系統負擔的情況下,使得資料管理及資料存取更加便利」。

「北京深度求索」的一份專利說明書,指出數據的來源包括各種開源資料集。(「北京深度求索」專利說明書)

事實上,日前多間美媒已引述知情人士指出,OpenAI及其合作夥伴Microsoft(微軟)去年已開始調查DeepSeek盜用其模型進行開發。而OpenAI已掌握一些證據,顯示DeepSeek透過「蒸餾」技術(distillation)來建造的,即以AI模型為模仿基礎,來訓練和改進,從而在低成本下達到同級的效果目標。另美國Meta免費開放的「Llama」亦疑是DeepSeek的「蒸餾」對象。

本台早前已報導,中國近年已成熟地利用美國開源模型進行開發,包括利用「Llama」並結合國產「百度」的「文心一言」、清華大學「智譜」研發的開源AI「ChatGLM」等大模型,提升解放軍AI的作戰能力。

DeepSeek成功之道二:民企、大學搜購大量美國晶片

第二,以「奇招」囤積美國晶片。即使中國向國內晶片業投資數以千億元人民幣,目前「最先進」的晶片是「中芯國際」7奈米晶片「麒麟9000S」,然而在欠缺技術和零件設備下,亦無法取代ChatGPT主要運用的美國「英偉達」的A100和H100晶片。

那如何達到ChatGPT的級數?本台據中共官方資料發現,在2022年9月至2023年10月美國逐步擴大對華的晶片出口禁令期間,DeepSeek的母企「幻方量化」,與一眾與中國政府關係密切的科企,包括百度、商湯、華為、騰訊、阿里以及字節跳動等大力投資AI的公司,分別囤購數以萬張英偉達A100和H100晶片,繼續其AI開發。尤其是制裁令實施初期,美方容許英偉達數月禁售「緩衝期」,包括推出性能稍低的A800及H800晶片供應中國。

本台亦發現,大學和仲介公司亦是中國取得英偉達先進晶片的渠道。過去2年,北京航空航天大學、深圳大學、鄭州大學、中國科學院大學和武漢大學和南方科技大學等十多高等科技院校,在美國制裁令下,仍一直招標採購英偉達A100和H100等晶片。

中國科學院大學2023年5月政府採購GPU伺服器,註明需搭載英偉達原廠晶片。(中國政府採購網)

而幻方量化亦積極與大陸多所大學合作研發,並在大學招攬年輕科技精英組成研發團隊;其模式與中國軍民融合的發展模式相似。

DeepSeek成功之道三:利用香港對外集資

第三,「背靠祖國」並利用香港對外集資。雖然DeepSeek宣布成本僅需600萬美元,惟遭外界質疑誇大事實,指出AI研發和生產資金成本,一般需至少數億美元。

據公開資料,早計晶片,英偉達A100和H100等晶片,平均每枚需約2萬美元。以DeepSeek宣布收購1萬枚來計,已涉及2億美元。

那DeepSeek的資金從何而來?本台發現,其除了藉助中國政府大筆補助外,亦利用幻方量化旗下多個資產管理公司,籌集多達千億元人民幣,造就其成為中國國內量化私募領域的「四大天王」。

其中,資金主力之一是來自幻方量化在2019年成立的「幻方資本管理(香港)有限公司」。該公司取得香港證監會發出的「資產管理牌照」(9號牌),意味著在國際資本市場上獲得了「通行證」,不僅可以直接參與境外的投資,還可管理運用海外投資者的資金,包括將外資送往大陸。

美智庫:中國利用「三招」逃避美國的制裁

美國詹姆斯敦基金會(Jamestown Foundation)副研究員張崑陽(Sunny Cheung)指出,這「三招」已成為中國成熟模式,逃避美國的制裁。

張崑陽說:「問題是(美國制裁禁令)執行上,往往依賴公司的盡職調查(due-diligence)和上報商務部,導致出現漏洞和灰色地帶。另一問題是香港作為國際金融中心,有自己的股票市場和金融體系,而這股票市場是否容易讓中國集資?這是必然的。尤其是,Deepseek彈起後,從政府角度,中國望熱錢(Hot money)或矽谷(Silicon Valley)資金重新流入中國市場,特別是中國人工智慧的建設上。而現在美國仍未有很建全的對外投資規定(Outbound investment regulations),即未有嚴格限制美國資金流入中國。其實美國晶片禁令在2023年才執行,而2022年首提禁令,當中有1、2年的空窗期,讓中國公司有機會大量搜購英偉達(Nvidia)晶片,或以不同名目設立子公司,繼而與『乾淨』且有能力取得高科技晶片的公司,透過仲介人、或第三國的模式取得晶片,這是很常見的做法。」

另值得留意的是,今次Deepseek的震撼推出,正值美國川普政府蘊釀新一輪對華晶片禁令的時機。本台發現,情況與2023年美國最初推出晶片禁令時相似,當時中國相繼推出宣稱不遜於ChatGPT的百度AI文心一言,以及搭載中芯麒麟9000S晶片的華為Mate60系列5G手機,大肆宣傳突破美國的圍堵。

侍建宇:Deepseek成績對「大內宣」有很大幫助

台灣國防安全研究院副研究員侍建宇指出,這都是中國宣傳戰略,試圖營造強者不敗的氣勢。

侍建宇說:「就算不是世界級的東西,也是名列前茅的一個AI技術。所以此情況之下,它對『大內宣』也是有很大的幫助,尤其在這1、2年中國的經濟不景之下。當然『大外宣』也是有效果的。因為畢竟它還是短期之內,造成了美國股票市場的震盪;從長期的角度而言,它最近幾年向『全球南方』,尤其金磚國家,表現出其實中國是有能力帶領她們在科技向前走。」

不過,侍建宇指出,雖然不少人質疑中國的AI和晶片發展「名過其實」,但仍要警惕中國發展的程度,以及訓練AI的目的,包括竊取個人資料和監控,「因為這都是不透明的」。他又關注到,愈來愈多事實證明香港是中國規避美國制裁的集資和集資的「中轉港」,所以他對香港前景並不樂觀。

責任編輯: 方尋  來源:RFA 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2025/0131/2168271.html