DeepSeek橫空出世攪動了AI江湖,各路人馬一陣驚駭之後回過神來,這玩意到底是不是真的?當然,主要是美國佬在懷疑。
1月29日,就是昨天,OpenAI和微軟正式指控DeepSeek盜取了OpenAI的數據。


這幾天大家都了解了DeepSeek的神奇,我也體驗了一下,效果確實很好,超出文心一言、通義千問十倍不止。
OpenAI執行長Sam Altman評價DeepSeek是一個不錯的模型,它與我們幾個月前的位置相當。意思是在Sam Altman看來,deepseek只是稍微落後一點點,幾個月時間。
然而達到目前的效率,它的訓練成本極低。由於眾所周知的晶片管制原因,據說DeepSeek訓練的時候只能用更低效率的英偉達 H800 GPU晶片,但就算這樣,只花了557.6萬美元就達到了目前的效果,而且目前完全開源、免費。作為對比,據說OpenAI訓練 GPT-4可能花了1億多美元。
但是疑問就在這裡,這不太像真的。

第一種懷疑是DeepSeek其實有更多的晶片。

馬斯克(Elon Musk)也在社交媒體X回應相關推文,並加上「顯而易見」的評論,似乎同意這項說法。馬斯克當然很了解中國人的智慧,我們有的是方法應對管制。
第二種懷疑是DeepSeek使用「蒸餾」技術。這就是昨天OpenAI和微軟的正式指控。但目前,OpenAI並未透露其發現的具體證據細節。
參照各路專家的解釋:「蒸餾」是一種常見的開發手段,開發者通過從更大、更強大的模型中提取數據來訓練自己的 AI模型。這種技術能夠以遠低於 OpenAI訓練 GPT-4所花費的1億美元以上的成本,高效地訓練出小型模型。儘管開發者可以通過 OpenAI的 API將其 AI技術整合到自己的應用程式中,但利用輸出數據來構建競爭模型則違反了 OpenAI的服務條款。彭博社報導,消息人士稱,微軟的安全研究人員在2024年底發現,大量數據通過 OpenAI開發者帳戶被導出,而這些帳戶被認為與 DeepSeek有關聯。
我不懂技術,我個人理解,這個「蒸餾」的意思是不是跟垃圾回收差不多。撿垃圾是很辛苦的,幾噸的垃圾堆里可能還翻不出100塊錢的塑料、廢舊金屬。

但是老王辛辛苦苦翻了垃圾山,統一拉回去放到了他的垃圾回收站。老張直接去老王的垃圾回收站撿,效率一下就高出十倍不是?

AI大模型難就難在對網際網路的語料清洗整理,為什麼文心一言確實讓人很難言呢?因為它對語料的清洗很垃圾。經常從百度文庫裡面隨便找個阿毛阿狗的資料回覆你。可謂垃圾輸入、垃圾輸出。這一點上,DeepSeek高出十倍,我注意到,它很注意引用權威信源。
但是DeepSeek很讓人疑惑的也在這裡,據很多朋友反饋,它會犯渾:

另外,我對它提了一個問題,你的知識庫更新到什麼時間?它回答:根據OpenAI的公開信息,我的知識庫更新到2023年10月。

不管怎樣,江湖早已血雨腥風。
一天時間,英偉達股票下跌16%,黃仁勛不得不迅速出面穩定軍心:「我們不是在製造晶片,而是在鑄造時間的鑰匙。」
東土大唐一片盛世歡騰,有人聲稱:deepseek是一場國運級別的成功。
DeepSeek的主人,那個已經名動江湖的少俠梁文鋒一邊謙卑的接過盛讚:「團隊讀到「國運級」這個形容時所有人頭皮都是麻的。我們不過是站在開源社區巨人們的肩膀上,給國產大模型這棟大廈多擰了幾顆螺絲「。
一邊驕傲的宣示未來:」一群不信邪的傻子,用代碼當磚瓦,拿算法做鋼筋,在資本與質疑的裂縫中,硬生生壘出通向未來的棧橋「。
當然,現在我們知道,兩封信都是假的。只有中國人超越美國的期盼是真的,我們多想把美國比下去啊。
你再想想黃仁勛和梁文鋒這仿寫的一問一答都出現在中文網際網路媒體就很有意思。
這就是當下的狀態:中國人做出一個東西,首先要談論的是有沒有震驚美國人!

我們太想把人比下去了。
當我們是個體時,我們要把兄弟姐妹、親戚朋友比下去;當我們是家族時,我們要把異姓鄉親比下去;當我們是一個城市時,我們要把廣州重慶比下去;當我們是一個國家民族時,我們要把美國佬小日本比下去。
中國人的生活挺糾結的,一和人比就累,一停下來就慌。
不成為第一就老在追趕,一路咬牙切齒,一路氣喘吁吁。如果成為第一,恐怕又會空虛找不到方向,失去生活的動力。
於是,不得不在無聊與雞血中反覆糾結。
最後說回來DeepSeek,我毫不懷疑中國人能夠做出這種驚艷的發明,我們是一個很優秀的民族;但是,如果最終發現確實使用了不誠實的技術,這其實也並不令人意外。


















