對(duì) DeepSeek 和智能下半場(chǎng)的幾條判斷

長(zhǎng)沙7喜 2025-02-08 發(fā)布于湖南

展開(kāi)全文

作者：李廣密

編輯：penny，Siqi

從 24Q3 開(kāi)始我們就一直在講 AI 的下半場(chǎng)，雖然 OpenAI o1 提出了 RL 敘事，但因?yàn)楦鞣N原因沒(méi)有破圈，DeepSeek R1 解了 RL 的謎題，推進(jìn)整個(gè)行業(yè)進(jìn)入了新范式，真正進(jìn)入智能下半場(chǎng)。

市場(chǎng)上關(guān)于 DeepSeek 是什么、為什么的討論已經(jīng)很多了，接下來(lái)更有價(jià)值討論是 AI race 要怎么 play ？把過(guò)去半個(gè)月的思考總結(jié)了一下，希望成為探索下半場(chǎng)的 road map，每隔一段時(shí)間來(lái)復(fù)盤。也列出了幾個(gè)最好奇的問(wèn)題，歡迎填寫問(wèn)卷一起交換想法，我們會(huì)圍繞下一個(gè)智能突破的 Aha moment 組織一場(chǎng)小范圍討論會(huì)：

· 下一個(gè)智能突破的 Aha moment 會(huì)從哪出現(xiàn)？

· 如果你有充裕的探索資源，你會(huì)把探索資源投入在什么方向上？

· 比如下一代 Transformer 架構(gòu)、合成數(shù)據(jù)的突破、Online Learning 更高效率的學(xué)習(xí)方式，你會(huì)有哪些 Bet？

Insight 01

DeepSeek 超越 OpenAI 了嗎？

DeepSeek 超越了 Meta Llama 毫無(wú)疑問(wèn)，但相比 OpenAI、Anthropic 和 Google 這些第一梯隊(duì) players 還有距離，比如 Gemini 2.0 Flash 成本比 DeepSeek 更低，能力也很強(qiáng)，且全模態(tài)，外界低估了 Gemini 2.0 為代表的第一梯隊(duì)的能力，只是沒(méi)有開(kāi)源而獲得這么炸裂轟動(dòng)性的效果。

DeepSeek 很讓人興奮，但還不能稱作范式級(jí)創(chuàng)新，更準(zhǔn)確的表述是將之前 OpenAI o1 半遮半掩的范式開(kāi)源，將整個(gè)生態(tài)推向很高滲透率。

從第一性原理角度，在 Transformer 這一代架構(gòu)下超越第一梯隊(duì)模型廠商是有難度的，同樣路徑下很難實(shí)現(xiàn)彎道超車可能，今天更期待有人能探索出下一代的智能架構(gòu)和范式。

DeepSeek 用一年時(shí)間

追上了 OpenAI 和 Anthropic

Insight 02

DeepSeek 開(kāi)啟新范式了嗎？

就像前面說(shuō)的，嚴(yán)格意義上說(shuō)，DeepSeek 沒(méi)有發(fā)明新范式。

但 DeepSeek 的重要意義在于幫助 RL 和 test time compute 這個(gè)新范式真正出圈。如果說(shuō) OpenAI 最初發(fā)布的 o1 是給行業(yè)出了一個(gè)謎語(yǔ)，DeepSeek 就是第一個(gè)公開(kāi)解謎的人。

DeepSeek 發(fā)布 R1 和 R1-zero 之前，行業(yè)只有少部分人在實(shí)踐 RL 和 reasoning model，但 DeepSeek 給大家指明了路線圖，讓行業(yè)相信這樣做真的能提升智能，這對(duì)提升信心，吸引更多 AI researcher 轉(zhuǎn)向新范式的研究有巨大的幫助。

有人才進(jìn)入，才有算法創(chuàng)新，有開(kāi)源緊追才有更多計(jì)算資源投入。在 DeepSeek 之后，原本計(jì)劃不再發(fā)新模型的 OpenAI 接連發(fā)出 o3mini，并計(jì)劃繼續(xù)發(fā)布 o3，還考慮開(kāi)源模型。Anthropic 和 Google 也會(huì)加快 RL 的研究。行業(yè)對(duì)新范式的推進(jìn)因?yàn)?DeepSeek 加快，中小團(tuán)隊(duì)也可以在不同的 domain 上嘗試 RL。

另外，reasoning model 的提升會(huì)進(jìn)一步幫助 agent 落地，AI researcher 現(xiàn)在都因此對(duì) agent 的研究和探索更有信心，因此也可以說(shuō) DeepSeek 開(kāi)源 reasoning model 推進(jìn)了行業(yè)向 Agent 的進(jìn)一步探索。

所以 DeepSeek 雖然沒(méi)有發(fā)明新范式，但推進(jìn)整個(gè)行業(yè)進(jìn)入了新范式。

Insight 03

Anthropic 的技術(shù)路線和 R1 有什么不同？

從 Dario的訪談可以看出，Anthropic對(duì)R-1/reasoning model的理解，與O系列有些分歧，Dario覺(jué)得 base model 與 reasoning model應(yīng)該是個(gè)連續(xù)光譜，而非 OpenAI 這種獨(dú)立的模型系列。如果只做 O 系列會(huì)很快遇到天花板。

我一直想為什么 Sonnet 3.5的coding、reasoning 和 agentic能力一下子提升這么強(qiáng)，但 4o 一直沒(méi)追上？

他們?cè)?pre training base model 階段就做了大量 RL 工作，核心還是把 base model 提上去，不然只靠 RL 提升 reasoning model 可能很容易把收益吃光。

Insight 04

DeepSeek 的轟動(dòng)有必然，也有偶然

兩位早期 OpenAI 研究員寫的《為什么偉大不能被計(jì)劃》形容 DeepSeek 也很合適。

技術(shù)角度上，DeepSeek 有下面幾個(gè)亮點(diǎn)：

· 開(kāi)源：開(kāi)源這點(diǎn)很重要，OpenAI 從 GPT-3 開(kāi)始轉(zhuǎn)為閉源公司后，第一梯隊(duì)三巨頭就不再公開(kāi)技術(shù)細(xì)節(jié)，拱手讓出了一個(gè)空白的開(kāi)源生態(tài)位，但 Meta 和 Mistral 并沒(méi)有接穩(wěn)這個(gè)位置，DeepSeek 這次堪稱奇襲，在開(kāi)源這塊大賽道一馬平川。

如果把轟動(dòng)性打 100 分，智能提升貢獻(xiàn) 30 分，開(kāi)源貢獻(xiàn) 70 分，之前 LLaMA 也開(kāi)源但沒(méi)有這么轟動(dòng)的效果，說(shuō)明 LLaMa 智能水平不夠。

· 便宜：“Your margin is my opportunity” 這句話的含金量還在上升。

· 聯(lián)網(wǎng)+公開(kāi) CoT：對(duì)于用戶這兩個(gè)點(diǎn)分別都能帶來(lái)很好的用戶體驗(yàn)，DeepSeek 把兩張牌同時(shí)出了，可以說(shuō)是王炸，給到 C 端用戶的體驗(yàn)和其他 Chatbot 完全不一樣。尤其是 CoT 透明，把模型思考過(guò)程公開(kāi)了，透明能讓用戶對(duì) AI 更信任，促進(jìn)了破圈。不過(guò)，按理說(shuō) Perplexity 也是沖擊很大的，但 DeepSeek 服務(wù)端不穩(wěn)定，Perplexity 團(tuán)隊(duì)快速反應(yīng)上線了 R-1 反而承接了很大 DeepSeek R-1 溢出的用戶。

· RL 泛化：雖然 RL 是 OpenAI o1 最先提出來(lái)的，但因?yàn)楦鞣N運(yùn)營(yíng)一直半遮半掩，滲透率并不高，DeepSeek R-1 很大意義推動(dòng)了 reasoning model 范式的進(jìn)程，生態(tài)接受度大幅提升。

DeepSeek 在技術(shù)上的探索投入是被這個(gè)智能成果值得更多人關(guān)注、討論的確定性因素，但 DeepSeek R1 推出的 timing 又讓這場(chǎng)轟動(dòng)帶有偶發(fā)性：

· 過(guò)去美國(guó)一直講自己在基礎(chǔ)技術(shù)研究上大幅領(lǐng)先，但 DeepSeek 原生于中國(guó)國(guó)內(nèi)，這本身也是一個(gè)亮點(diǎn)，這個(gè)過(guò)程中，又有很多美國(guó)科技大佬開(kāi)始去宣揚(yáng) DeepSeek 挑戰(zhàn)了美國(guó)科技霸主的地位的論調(diào)，DeepSeek 屬于被動(dòng)卷進(jìn)輿論戰(zhàn)；

· DeepSeek R1 發(fā)布之前，OpenAI Stargate $500B 事件剛剛開(kāi)始發(fā)酵，這種巨量投入和 DeepSeek 團(tuán)隊(duì)智能產(chǎn)出效率對(duì)比太鮮明了，很難不引發(fā)關(guān)注、討論；

· DeepSeek 讓英偉達(dá)股價(jià)大跌又進(jìn)一步讓輿論發(fā)酵，他們肯定也想不到自己成為了 2025 開(kāi)年美股第一只黑天鵝；

· 春節(jié)是產(chǎn)品的練兵場(chǎng)，移動(dòng)互聯(lián)網(wǎng)時(shí)代很多超級(jí) App 都是在春節(jié)大爆發(fā)的，AI 時(shí)代也不例外。DeepSeek R1 恰好在春節(jié)前發(fā)布，大眾驚喜的是它的文字創(chuàng)作能力，而不是訓(xùn)練時(shí)候強(qiáng)調(diào)的 coding 和數(shù)學(xué)能力，文創(chuàng)更容易被大眾用戶有體感，也更容易 go viral。

Insight 05

誰(shuí)受傷？誰(shuí)受益？

可以把這個(gè)賽場(chǎng)上的 players 分 3 類：ToC、To Developer 以及 To Enterprise（ to Government）：

1. ToC：Chatbot 肯定受沖擊最大，心智和品牌關(guān)注度被 DeepSeek 搶走了，ChatGPT 也不例外；

2. 在開(kāi)發(fā)者環(huán)節(jié)的影響很有限，我們看到有用戶用完之后說(shuō)評(píng)論 r1 不好用不如 sonnet，Cursor 官方也說(shuō) Sonnet 還是 outperform，用戶 surprisingly 高比例都選擇 Sonnet，并沒(méi)有大幅遷移；

3. 第三個(gè)維度，To Enterprise 和 To Government 的生意在于信任和需求理解，大型組織做決策的利益考慮很復(fù)雜，不會(huì)像 C 端用戶那么容易遷移。

再換個(gè)角度，從閉源、開(kāi)源和算力的視角想這個(gè)問(wèn)題：

短期大家會(huì)覺(jué)得閉源的 OpenAI/Anthropic/Google 更受沖擊：

· 技術(shù)神秘感被開(kāi)源了，AI hype 里面最重要的神秘感的溢價(jià)被打破；

· 更現(xiàn)實(shí)的因素，市場(chǎng)認(rèn)為這幾家閉源公司的潛在客戶和市場(chǎng)規(guī)模被搶走了一些，GPU 投入的回本周期變長(zhǎng)；

· 作為領(lǐng)頭羊的 OpenAI 在其中屬于最“吃虧”的那個(gè)，之前想捂著技術(shù)不開(kāi)源，半遮半掩，希望多賺技術(shù)溢價(jià)的美夢(mèng)無(wú)法實(shí)現(xiàn)了。

但中長(zhǎng)期看，GPU 資源充裕的公司還是受益的，一方面是第二梯隊(duì)的 Meta 可以快速跟進(jìn)新方法，Capex 更加 efficient，Meta 可能是很大受益者，另一方面是智能提升還需要更多探索，DeepSeek 開(kāi)源把大家水平拉齊，進(jìn)入全新探索又需要 10 倍甚至更大量級(jí)的 GPU 投入。

從第一性原理來(lái)想，對(duì)于 AI 智能產(chǎn)業(yè)來(lái)說(shuō)，無(wú)論是發(fā)展智能還是應(yīng)用智能，從物理本質(zhì)上就必然要消耗海量算力，這是基礎(chǔ)定律決定的，不是技術(shù)優(yōu)化能完全規(guī)避的。

所以，無(wú)論是探索智能，還是應(yīng)用智能，即便短期有質(zhì)疑，中長(zhǎng)期的算力需求也會(huì)爆炸，這也解釋了為什么馬斯克從第一性原理出發(fā)，xAI 堅(jiān)持?jǐn)U建集群，xAI 和 Stargate 背后的深層邏輯也許是一樣的。Amazon 等云廠商都宣布了要增加 Capex 指引。

我們就假設(shè)全球的 AI research 人才水平和認(rèn)知都拉齊，有更多 GPU 就可以做更多實(shí)驗(yàn)探索？最后可能還是回到 compute 的競(jìng)爭(zhēng)。

DeepSeek 光腳不怕穿鞋，沒(méi)有商業(yè)化訴求，專注 AGI 智能技術(shù)探索，開(kāi)源這個(gè)動(dòng)作對(duì)推動(dòng) AGI 進(jìn)程推動(dòng)意義很大，加劇了競(jìng)爭(zhēng)，推動(dòng)了開(kāi)放性，頗有鯰魚(yú)效應(yīng)。

Insight 06

蒸餾能超越 SOTA 嗎？

有個(gè)細(xì)節(jié)點(diǎn)不確定，如果 DeepSeek 從 pre train 階段就大量使用蒸餾的 CoT 數(shù)據(jù)，那做到今天效果不算驚艷，還是在第一梯隊(duì)巨頭的肩膀上獲得的基礎(chǔ)智能，然后再開(kāi)源出來(lái)；但如果 pre train 階段沒(méi)有大量用蒸餾數(shù)據(jù)，DeepSeek 從 0 做 pre train 做到今天的效果，那就堪稱驚艷了。

另外，蒸餾能否在 base model 超越 SOTA，應(yīng)該是不太可能的。但 DeepSeek R-1 非常強(qiáng)，猜測(cè)是 Reward model 做的非常好，如果 R-1 Zero 這條路徑靠譜，是有機(jī)會(huì)超越 SOTA。

Insight 07

No Moat !

Google 之前對(duì) OpenAI 的一個(gè)評(píng)價(jià)：No Moat！這句話放在這里也很應(yīng)景。

DeepSeek 這一波 Chatbot 用戶又出現(xiàn)了大量遷移現(xiàn)象，給了市場(chǎng)一個(gè)很重要的啟發(fā)：智能技術(shù)進(jìn)步非常陡峭，階段性產(chǎn)品很難形成絕對(duì)壁壘。

不管是 ChatGPT/Sonnet/Perplexity 剛形成了心智和口碑，還是 Cursor、Windsurf 這類開(kāi)發(fā)者工具，一旦有了更智能的產(chǎn)品，用戶對(duì)“上一代”智能的產(chǎn)品毫無(wú)忠誠(chéng)度，今天不管是模型層還是應(yīng)用層都很難構(gòu)建護(hù)城河。

DeepSeek 這次也驗(yàn)證了一件事：模型即應(yīng)用，DeepSeek 在產(chǎn)品形式上沒(méi)任何創(chuàng)新，核心就是智能+開(kāi)源，我也不禁思考：在 AI 時(shí)代，任何產(chǎn)品和商業(yè)模式的創(chuàng)新都比不上智能的創(chuàng)新嗎？

Insight 08

DeepSeek 應(yīng)該承接

這波 Chatbot 流量并做大嗎？

從 Chatbot 爆火到今天，通過(guò) DeepSeek 團(tuán)隊(duì)的反應(yīng)可以明顯感覺(jué)出來(lái)，DeepSeek 還沒(méi)想好怎么用這波流量。

而要不要接住、并積極運(yùn)營(yíng)這批流量這個(gè)問(wèn)題的本質(zhì)是，偉大的商業(yè)公司和偉大的 research lab 能共存在一個(gè)組織嗎？

這件事非?？简?yàn)精力和資源分配、組織能力和戰(zhàn)略選擇，如果是字節(jié)、Meta 這類大公司，他們的第一反應(yīng)應(yīng)該都要接下來(lái)，也有一定組織基礎(chǔ)可以接下來(lái)，但 DeepSeek 作為一個(gè) research lab 組織，承接這波巨量流量的壓力必然很大。

但同時(shí)也要想這一波 Chatbot 會(huì)是階段性流量嗎？Chatbot 是不是在未來(lái)智能探索的主線下？似乎感覺(jué)每個(gè)智能階段都有對(duì)應(yīng)的產(chǎn)品形態(tài)，而 Chatbot 只是解鎖的其中一個(gè)早期形態(tài)。

對(duì)于 DeepSeek 來(lái)說(shuō)，從未來(lái) 3-5 年視角看，如果今天不去承接 Chatbot 流量，會(huì)不會(huì)是一種 miss？萬(wàn)一哪天跑出規(guī)模效應(yīng)？如果 AGI 最終實(shí)現(xiàn)了，又會(huì)是什么載體來(lái)承接？

Insight 09

下一個(gè)智能突破的 Aha moment 從哪來(lái)？

一方面，第一梯隊(duì)的下一代模型很關(guān)鍵，但今天我們又處在 Transformer 的極限邊界上，第一梯隊(duì)能否拿出代際提升的模型也不確定。OpenAI、Anthropic 和 Google 作為回應(yīng)發(fā)出來(lái)好 30-50%的模型可能都不夠挽回局勢(shì)，因?yàn)樗麄冑Y源多了 10-30 倍。

另一方面， Agent 落地比較關(guān)鍵，因?yàn)?Agent 需要做長(zhǎng)距離多步驟推理，如果模型好 5-10%，領(lǐng)先的效果就會(huì)被放大很多倍，所以 OpenAI、Anthropic 和 Google 一方面要做 Agent 產(chǎn)品落地，full stack 集成模型+Agent 產(chǎn)品，就像 Windows+Office，二是也要 show 出來(lái)更強(qiáng)大的模型，比如 O3 完整版、Sonnet 4/3.5 opus 為代表的下一代模型。

在技術(shù)不確定性下，最寶貴的是天才 AI researchers，任何想要探索 AGI 的組織都要投入資源更激進(jìn)的 bet on next paradigm，尤其是在今天 pre training 階段已經(jīng)被拉齊的背景下，要有好的人才+充裕資源，探索下一個(gè)智能涌現(xiàn)的 Aha moment。

Insight 10

DeepSeek 這一波讓我對(duì)

中國(guó) AI 人才更有信心，非常鼓舞

最后，希望技術(shù)無(wú)國(guó)界。

排版：楊樂(lè)樂(lè)

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：長(zhǎng)沙7喜 > 《AI有關(guān)》

舉報(bào)/認(rèn)領(lǐng)