佘宗明｜DeepSeek啟示錄：創新都是自己產生的，不是刻意安排的＊阿波羅新聞網

魚眼觀察｜DeepSeek啟示錄：創新都是自己產生的，不是刻意安排的

正如梁文鋒所說：「創新都是自己產生的，不是刻意安排的。」

文|佘宗明

「國運級科技突破」「美國的斯普特尼克時刻」「AI珍珠港事件」……DeepSeek颳起的「最炫民族AI風」，遠沒有停下來的跡象。

看上去，DeepSeek才是「過年檔」最大贏家：成立僅1年半的DeepSeek於無聲處釀出了驚雷，堪比作「魔童鬧海」；使出降龍十八掌直接重創納斯達克的DeepSeek提振了國人信心，不啻為「俠之大者」；掀起AI領域「算力起義」的DeepSeek改寫了AI權力遊戲規則，配得上被「封神」。

正因如此，在國內外輿論場，DeepSeek幾乎被各種震驚體圍裹。

▲《黑神話·悟空》製作人馮驥將DeepSeek-R1視作國運級別的科技成果。

在宏大敘事框架下，DeepSeek的異軍突起，很容易被人拿來跟華為突破美國封堵重新推出「爭氣機」5G手機華為Mate60 Pro並論，跟大國科技崛起的話語綁定。

在晶片法案與TikTok剝離法案已成中美科技競賽烈度直觀反映的當下，這類解讀在所難免。

但不能因此就抹殺DeepSeek奇蹟中「去Nationalism」的部分，要看到，DeepSeek能變成眼下的DeepSeek，跟很多具體因素有關，如梁文鋒的極致技術理想主義，如DeepSeek人才使用的反經驗主義。

也正是DeepSeek身上的多重獨特性，使得它可以像荊棘花那般不懼凜風與涸土地盛開。

在我看來，如果要用一句話總結DeepSeek啟示錄的精髓，那就是：偉大不能被計劃。

「偉大不能被計劃」，言下之意是，不要試圖去設計規劃好一切，很多事情本就是「無心插柳」的結果。

DeepSeek能同時登頂蘋果App Store中美下載排行榜第一，就是最直觀的驗證。它的崛起之路，有著太多的「讓人意想不到」。

在9個月前，許多人印象中的國內AI頭部玩家，還是以BAT和字節為代表的大廠和AI大模型六小虎（智譜AI、月之暗面、百川智能、MiniMax、階躍星辰、零一萬物）。

誰能想到，「名少見經傳」的DeepSeek能戳穿性價比天花板，證明「明明是主流玩家的電影，我卻偏偏要有姓名」呢？

在1個多月前，很多人認知中的OpenAI挑戰者，依舊在矽谷——紅杉資本此前就認為，現在AI領域是五強爭霸：微軟+OpenAI，亞馬遜+Antropic，谷歌，Meta和xAI。

誰能想到，DeepSeek能用OpenAI僅約1/10的預訓練成本，就推出了性能可與GPT-4o、Claude3.5 Sonnet等頂尖閉源模型相匹敵的DeepSeek-V3呢？

在10多天前，有些人仍然會認為，DeepSeek-V3隻是曇花一現，連DeepSeek都很難再複製DeepSeek。

誰能想到，DeepSeek又掏出了成本依舊低廉、性能更加強大的DeepSeek-R1（性能可對標OpenAI o1正式版，API服務定價則要低上27-55倍），直接震驚歐美科技界呢？

▲DeepSeek-R1引發美股地震後，引起國內外媒體廣泛關注。

事實上，就在DeepSeek-V3發布時，依然有國內專家將Deepseek視作小米Su7，「神似某捷的外型、單層的、民用級剎車卡鉗、大概其的隔音……雖然一上賽道跑幾圈剎車就嚴重衰減，雖然里里外外都是蔚小理玩過的東西，沒有技術和形態突破。」有國外人士認為DeepSeek雖然拿出了「30美元iPhone」，但那只是平替。

但DeepSeek-R1用川普震驚、山姆·奧特曼嘆服、馬斯克「內涵」的反應證明了，它確實不是池中物。

而今，不少國內網友儼然用滿屏驚嘆擺成了四郎的表情包：你還有多少驚喜是朕不知道的？

「偉大不能被計劃」，也是因為，很多「偉大」的事物一開始可能是「微小」的。

DeepSeek能不能承載起「國運級成果」的名頭，興許還有爭議，但它確實當得起「神奇」二字。

DeepSeek-R1究竟厲害在哪？懂技術的人興許張口就是一堆名詞：合成數據、知識蒸餾、FP8低精度、稀疏模型、MoE、多頭注意力機制……

這些技術未必是首創，但DeepSeek能利用既有技術，實現訓練量效比、算力能效比的極致提升，也是現象級突破。

都說「多少輛馬車相加，都加不出一輛汽車來。」賈伯斯當年發明iPhone，不是在功能機上疊加MP3、攝影機等功能，而是用觸控式螢幕體驗+軟硬體一體化重新定義了手機。DeepSeek的難得之處也在於「重新定義」——它打破了路徑依賴，重新定義了算力提升方式。

有人這樣比喻：若是把提升算力視作蓋樓，那OpenAI就是狂堆磚塊（晶片硬體），DeepSeek則是依託發明鋼筋混凝土（數學框架創新）來重塑建造方式。

OpenAI讓大模型研發變成了比誰磚塊多的比賽，DeepSeek則讓大模型研發變成了比誰建築方式更高效的PK。

▲有網友這樣調侃OpenAI跟DeepSeek的差別。

DeepSeek只是個200多人的公司，卻能挾工程能力優勢用算法優化「發明」出算力倍增器，干出很多國內外大廠都沒幹出的事來，這不免讓人想起凱文·凱利在《5000天後的世界》中的那句話——「未來最成功的那個公司，必然是今天還默默無聞的、在社交媒體領域外的某個小公司。」

小就是大。在大公司成功的經驗成為它們的桎梏時，創業公司卻可以以好奇心驅動的創新動能、扁平無層級的組織架構，展現出更大的創新勢能來。

DeepSeek就是典型。AI創業公司的高強活力跟梁文鋒的高維認知疊合後，產生的化學反應十分驚人。

梁文鋒對AGI（通用人工智慧）的技術信仰，對中美AI差距本質是「原創與模仿之差」的清醒洞見，對「閉源的護城河是短暫的，OpenAI閉源也無法阻止被趕超」的前瞻判斷，本就體現了高於行業的認知能力。

DeepSeek採用無層級的靈活協作機制，重潛力和好奇心不重行業經驗的招聘標準，開源的生態戰略，都與此有關，也放大了其勢能。

因而，DeepSeek可以在朱嘯虎式判斷廣受推崇的時下，篤定「不做應用，專注大模型研究」的長期主義戰略，可以在OpenAI路線大行其道的情況下，擁抱更高效更開放的AI發展道路。

為什麼是DeepSeek？部分答案就藏在其中。

「偉大不能被計劃」，也意味著，那些偶然性與獨特性不該被忽略。

行業專家楊寬老師就說：當OpenAI沉迷於暴力堆料時，DeepSeek團隊在玩「算力俄羅斯方塊」——把每個CUDA核心的價值壓榨到小數點後四位，就硬體利用率而言，矽谷利用GPU群組通信損耗技術達到了30%-40%，DeepSeek則利用自研MoE+動態路由算法達到了78%，「這不是技術差距，而是工程思維的代際碾壓。」

這背後就離不開DeepSeek團隊提出的MLA架構創新，它藉此將顯存占用降至傳統方法的5%-13%。背後的背後則是一年輕研究員的突然靈感和突發奇想。

他還講到，梁文鋒將量化交易思維注入AI訓練當中：風險對沖（用多模態數據構建「投資組合」）、高頻調參（在行業標準72小時/次的前提下，每2小時優化一次超參數）、動態止損（自動終止低效訓練分支），這套「華爾街鍊金術」使得DeepSeek的每次訓練都像在玩《文明6》的科技樹速通。

這很容易讓人想到肯尼斯·斯坦利和喬爾·雷曼在《為什麼偉大不能被計劃》中舉的例子：發明飛機的萊特兄弟，最早其實是自行車製造商；真空管是早期計算機的奠基性零件，但真空管的誕生與計算機毫無關係……

做量化交易起家的梁文鋒，創造出了「心價比」超強的AI大模型，又為其新添了案例。

▲被很多歪果仁稱作「東方神秘力量」的DeepSeek，發展路徑有其獨特性。

DeepSeek被津津樂道的，還有其開源模式：在OpenAI背離初心變成CloseAI的背景下，DeepSeek變成了真正Open的AI；在OpenAI把開發者當「數字佃農」時，DeepSeek用開源協議發動「AI土地革命」……這也是其了不起的地方。

這也跟梁文鋒的技術理想主義氣質緊密相關。換個人，可能又是師山姆·奧特曼長技以制競爭對手的打法了。

梁文鋒說：「創新都是自己產生的，不是刻意安排的。」

這相當於拍了拍肯尼斯·斯坦利們，並向他們表達了認同。因為肯尼斯·斯坦利說：真正的偉大是計劃不出來的，跟著好奇心一步一步走，才是成就非凡的正確路徑。

「偉大不能被計劃」，所以那些看似很小的種子，沒準也能「開出花，伸出新長的枝椏」；那些在邊緣地帶、外圍區域、隱秘角落的探索，興許也能「小力出奇蹟」。

跟國外的GAFA（谷歌蘋果臉書亞馬遜）和英偉達、國內的BAT一樣，DeepSeek不是計劃出來的，而是在適宜土壤上長成的。

既然創新是激發好奇心、激活創造性後擺脫路徑依賴的產物，而非計劃出來的結果，那對於創新應有的呵護與激勵，也不該是回到路徑依賴中去，而是為那些好奇心與創造性提供良好的制度環境，包括包容氛圍、試錯空間。

就目前看，DeepSeek走紅後，輿論場中有些反應就值得警惕，這其中的某些反應，更進一步通向的就是那種對「計劃」的路徑依賴。具體來說就包括：

一，將DeepSeek的突破導入Nationalism的語境中，認為要將其作為「AI國家隊」來加以收編、大力扶持。

「自創生」的DeepSeek，不需要揠苗助長，只需要適合創新的氣候土壤。

仔細看會發現，從《黑神話·悟空》到宇樹科技的機器狗再到DeepSeek在StyleCtrl類別中排第一的大模型，都誕生在杭州。

這不是偶然。通常而言，市場底色足-民營企業多-創新氛圍濃-經濟活力足-發展機遇廣-成為未來科技中心概率大，是一體的。

尊重市場、鼓勵創新、擁抱開放、包容失敗，培育適宜創新的市場生態，就可能會有更多企業——包括中小民營企業，像DeepSeek一樣冒出來。

倒是那些以關懷為名的干預，以擔當為由的裹挾，可能會抑制其活力。

二，以「干翻矽谷，單挑華爾街」的「厲害了，我的DS」態度，將其推向大時代的旋流中。

在美國持續升級對華AI晶片限制的背景下，DeepSeek利用華為晶片、中國本土AI人才、更低的算力成本研發出了性能領先的大模型，激發民族自信心和自豪感很正常，被寄予打破卡脖子局面的厚望也很正常。

但這不應導向對DeepSeek的無意識捧殺，更不應通往對「脫鉤斷鏈論」的裡應外合。

把DeepSeek的突破視作「國運級」的，箇中的揚眉吐氣心態可以理解，饒是如此，也該儘量避免把企業跟「干翻」「單挑」之類的字眼關聯，否則很可能迎合外部的那些「××威脅論」，將其無形中推到靶子位置。

往大了說，我們不該在「妄自菲薄」和「妄自尊大」兩極間橫跳。

《暗知識》作者王維嘉就認為，從技術格局來看，儘管 DeepSeek的成果縮小了中美在人工智慧技術上的差距，但中美人工智慧整體格局尚未被撼動。

他覺得，「在人工智慧技術的幾個關鍵方面，晶片領域中國仍與美國存在較大差距；在算法突破方面，過去十年間，從2012年的 alexnet到2017年的 transformer，再到2022年的 ChatGPT以及後續的思維鏈、RAG和推理訓練等重大突破，大多發生在美國，法國的 Mistral公司也有少量貢獻，DeepSeek的貢獻占比約為5%，但這已然十分了不起。」

接下來，我們需要更多DeepSeek出來去縮小差距，而不是在捧殺DeepSeek中掐滅火種。

說到底，DeepSeek的勝利，是對《為什麼偉大不能被計劃》中那個觀點的最佳註解——「在探索未知領域的過程中，保持對有趣事物的開放性，在搜索到足夠數量的踏腳石之後，偉大的成就自然就會與我們不期而遇。」

DeepSeek邁出了AI發展史上的重要一步，免不了被置於未來大國博弈、科技競爭的框架下打量。

但無論如何，別忘了——

DeepSeek的創新不是計劃出來的，DeepSeek的創新被看到後也不需要「計劃」來裹挾。

責任編輯： 李安達 　來源：微信公眾號「魚眼觀察」轉載請註明作者、出處並保持完整。

佘宗明｜DeepSeek啟示錄：創新都是自己產生的，不是刻意安排的

相關新聞