評論 > 言論 > 正文

袁斌:牛皮吹破?DeepSeek身陷四大質疑

作者:

兩名美國國會議員呼籲川普(川普)政府考慮限制英偉達(Nvidia)生產的H20人工智慧晶片出口,稱中國人工智慧公司DeepSeek(深度求索)依賴這些晶片。

前幾天,DeepSeek的消息引發了美國金融市場的風波。大陸媒體和小粉紅更是興奮地將DeepSeek吹捧為所謂的「中國AI崛起的象徵」。

然而,在一片喧囂之中,DeepSeek也身陷諸多質疑和批評——其技術突破是否真正具有創新性?團隊的透明度是否足夠?市場營銷是否存在誇大成分?

技術突破來自對美國技術的「盜用」?

中方高調宣稱DeepSeek的技術突破來自於中國的自主創新,但據海外媒體報導,ChatGPT的所有者微軟OpenAI認為,DeepSeek不當獲取了自己的核心數據和模型。

OpenAI1月29日表示,它們已掌握證據,顯示DeepSeek盜用其模型進行開發。

白宮人工智慧與加密特使大衛·O·薩克斯(David Sacks)也表示,有大量證據表明DeepSeek利用OpenAI的模型輸出數據,建立了自己的訓練集,而這種方法在業界被稱為「蒸餾」或「模型復現」。

從當前公開信息來看,DeepSeek的核心技術框架,如大規模預訓練、Transformer架構和優化算法,確實與OpenAI、Google DeepMind等公司的研究成果有相似之處。

新唐人報導,一名AI專業人員透露:DeepSeek確實有一些原創技術,包括減少了對GPU的使用,但在數據上主要是用了60萬長鏈條數據集,其中大部分是蒸餾獲得的,然後結合了多輪投票增強學習,變成了自己的東西。什麼意思呢?就是說,這是一個比較聰明的小偷或抄作業的,但還是做了。

實際上,DeepSeek自己也招了。很多人在問它是誰的時候,它有時回答自己是ChatGPT,有時說是GPT-4,還老老實實地交代自己使用了OpenAI的哪些工具。

據悉,目前微軟和OpenAI正在進行深入調查,同時已經封禁了與DeepSeek相關的可疑帳戶。如果證據確鑿,這可能是近年來AI領域最大的數據盜竊案之一。

DeepSeek的真實實力究竟如何?

DeepSeek號稱是國內少數能夠「對標GPT-4」的模型之一,但實際體驗後,許多用戶發現其表現仍然存在較大的差距。儘管官方在多個平台展示了測試結果,但這些結果往往是經過精挑細選的最佳案例,而非隨機樣本的真實評測。一些用戶反饋,DeepSeek在長文本理解、邏輯推理以及代碼生成等核心能力上仍有明顯短板,甚至在某些任務上表現不如早期版本的 ChatGPT3.5。

此外,DeepSeek的論文與技術文檔相對較少,缺乏詳實的技術細節披露。與OpenAI、Anthropic等國際領先團隊相比,DeepSeek在學術透明度方面仍存在很大欠缺。

DeepSeek「高調宣傳+低調研究」的模式,也是讓人懷疑其是否真正具備自主創新能力,抑或只是藉助現有開源技術,進行包裝和二次開發的一個重要原因。

DeepSeek的成本真的挑戰美國最強AI?

DeepSeek聲稱其大模型是在「低算力條件」下訓練完成的,V3模型訓練成本僅為560萬美元,這比OpenAI、Meta等用於預訓練大型語言模型動輒數億美元的成本要低得多。這一說法雖然吸引眼球,但從技術角度來看,仍然存在諸多疑點。許多專家,包括馬斯克和Scale AI的執行長Alexandr Wang,都不相信。

首先,大模型訓練的核心成本來自於算力。現階段,主流大模型(如GPT-4級別)通常需要數萬個高性能GPU(如 A100、H100)連續訓練數月。而根據市場價格,單張H100的售價高達2萬美元,即便是雲租賃,長期大規模使用的成本也十分昂貴。在如此高昂的算力消耗下,DeepSeek如何以560萬美元的預算完成訓練,值得深究。

其次,訓練成本不僅包括算力消耗,還涉及數據採購、存儲、工程優化、人力成本等多個方面。高質量的訓練數據需要清洗、標註,並經過多輪優化,而這本身就是一筆巨大開銷。此外,大模型的訓練往往需要反覆疊代調整,以提升最終性能,而非一次性完成。DeepSeek是否通過某種特殊技術或極端優化手段大幅降低成本?如果是,其方法為何未在業界廣泛應用?

此外,DeepSeek作為一家中國公司,其GPU採購渠道是否受限也是一個需要考量的問題。由於全球晶片供應鏈的限制,中國市場上的高端GPU價格通常高於海外,且獲取難度較大。在這種情況下,其低成本訓練的實現路徑更顯得撲朔迷離。

DeepSeek是真開源還是「半開源」?

DeepSeek宣布開源模型,初看似乎是一項重大利多,但仔細審視後,人們發現所謂的「開源」並不徹底。真正的訓練細節、優化策略、數據來源等核心信息仍然沒有完全公開,導致業界難以對其技術路線進行嚴肅的學術分析。真正的開源應該像Meta旗下的 Llama或Mistral那樣,將關鍵代碼和方法論徹底公開,而不是「半遮半掩」。相較於Llama系列、Mistral AI等更開放的做法,DeepSeek的開源行為更像是一種「半開源」,目的可能更多是為了博取關注和市場認可,而非推動整個AI生態的發展。

更值得注意的是,DeepSeek也可能受到中共官方政策與監管壓力的影響,導致其開源策略受到掣肘。如果一個模型在技術上宣稱要與國際一流對標,卻在透明度上選擇性「封閉」,那麼這種開源行為是否只是營銷手段,而非真正的技術貢獻?

面對眾多質疑的DeepSeek,可以說現在正站在一個關鍵的十字路口:如果真的要「深度求索」,那麼必須拿出紮實的技術和真正的突破,而不是靠一輪又一輪的營銷造勢來維持熱度。否則,它最終可能淪為又一個AI泡沫,被市場無情淘汰。

責任編輯: 李廣松  來源:大紀元 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2025/0202/2169206.html