![]() 作者:李廣密 編輯:penny,Siqi ![]() 從 24Q3 開(kāi)始我們就一直在講 AI 的下半場(chǎng),雖然 OpenAI o1 提出了 RL 敘事,但因?yàn)楦鞣N原因沒(méi)有破圈,DeepSeek R1 解了 RL 的謎題,推進(jìn)整個(gè)行業(yè)進(jìn)入了新范式,真正進(jìn)入智能下半場(chǎng)。 市場(chǎng)上關(guān)于 DeepSeek 是什么、為什么的討論已經(jīng)很多了,接下來(lái)更有價(jià)值討論是 AI race 要怎么 play ?把過(guò)去半個(gè)月的思考總結(jié)了一下,希望成為探索下半場(chǎng)的 road map,每隔一段時(shí)間來(lái)復(fù)盤。也列出了幾個(gè)最好奇的問(wèn)題,歡迎填寫問(wèn)卷一起交換想法,我們會(huì)圍繞下一個(gè)智能突破的 Aha moment 組織一場(chǎng)小范圍討論會(huì): · 下一個(gè)智能突破的 Aha moment 會(huì)從哪出現(xiàn)? · 如果你有充裕的探索資源,你會(huì)把探索資源投入在什么方向上? · 比如下一代 Transformer 架構(gòu)、合成數(shù)據(jù)的突破、Online Learning 更高效率的學(xué)習(xí)方式,你會(huì)有哪些 Bet? Insight 01 DeepSeek 超越 OpenAI 了嗎? DeepSeek 超越了 Meta Llama 毫無(wú)疑問(wèn),但相比 OpenAI、Anthropic 和 Google 這些第一梯隊(duì) players 還有距離,比如 Gemini 2.0 Flash 成本比 DeepSeek 更低,能力也很強(qiáng),且全模態(tài),外界低估了 Gemini 2.0 為代表的第一梯隊(duì)的能力,只是沒(méi)有開(kāi)源而獲得這么炸裂轟動(dòng)性的效果。 DeepSeek 很讓人興奮,但還不能稱作范式級(jí)創(chuàng)新,更準(zhǔn)確的表述是將之前 OpenAI o1 半遮半掩的范式開(kāi)源,將整個(gè)生態(tài)推向很高滲透率。 從第一性原理角度,在 Transformer 這一代架構(gòu)下超越第一梯隊(duì)模型廠商是有難度的,同樣路徑下很難實(shí)現(xiàn)彎道超車可能,今天更期待有人能探索出下一代的智能架構(gòu)和范式。 ![]() DeepSeek 用一年時(shí)間 追上了 OpenAI 和 Anthropic Insight 02 DeepSeek 開(kāi)啟新范式了嗎? 就像前面說(shuō)的,嚴(yán)格意義上說(shuō),DeepSeek 沒(méi)有發(fā)明新范式。 但 DeepSeek 的重要意義在于幫助 RL 和 test time compute 這個(gè)新范式真正出圈。如果說(shuō) OpenAI 最初發(fā)布的 o1 是給行業(yè)出了一個(gè)謎語(yǔ),DeepSeek 就是第一個(gè)公開(kāi)解謎的人。 DeepSeek 發(fā)布 R1 和 R1-zero 之前,行業(yè)只有少部分人在實(shí)踐 RL 和 reasoning model,但 DeepSeek 給大家指明了路線圖,讓行業(yè)相信這樣做真的能提升智能,這對(duì)提升信心,吸引更多 AI researcher 轉(zhuǎn)向新范式的研究有巨大的幫助。 有人才進(jìn)入,才有算法創(chuàng)新,有開(kāi)源緊追才有更多計(jì)算資源投入。在 DeepSeek 之后,原本計(jì)劃不再發(fā)新模型的 OpenAI 接連發(fā)出 o3mini,并計(jì)劃繼續(xù)發(fā)布 o3,還考慮開(kāi)源模型。Anthropic 和 Google 也會(huì)加快 RL 的研究。行業(yè)對(duì)新范式的推進(jìn)因?yàn)?DeepSeek 加快,中小團(tuán)隊(duì)也可以在不同的 domain 上嘗試 RL。 另外,reasoning model 的提升會(huì)進(jìn)一步幫助 agent 落地,AI researcher 現(xiàn)在都因此對(duì) agent 的研究和探索更有信心,因此也可以說(shuō) DeepSeek 開(kāi)源 reasoning model 推進(jìn)了行業(yè)向 Agent 的進(jìn)一步探索。 所以 DeepSeek 雖然沒(méi)有發(fā)明新范式,但推進(jìn)整個(gè)行業(yè)進(jìn)入了新范式。 Insight 03 Anthropic 的技術(shù)路線和 R1 有什么不同? 從 Dario的訪談可以看出,Anthropic對(duì)R-1/reasoning model的理解,與O系列有些分歧,Dario覺(jué)得 base model 與 reasoning model應(yīng)該是個(gè)連續(xù)光譜,而非 OpenAI 這種獨(dú)立的模型系列。如果只做 O 系列會(huì)很快遇到天花板。 我一直想為什么 Sonnet 3.5的coding、reasoning 和 agentic能力一下子提升這么強(qiáng),但 4o 一直沒(méi)追上? 他們?cè)?pre training base model 階段就做了大量 RL 工作,核心還是把 base model 提上去,不然只靠 RL 提升 reasoning model 可能很容易把收益吃光。 Insight 04 DeepSeek 的轟動(dòng)有必然,也有偶然 兩位早期 OpenAI 研究員寫的《為什么偉大不能被計(jì)劃》形容 DeepSeek 也很合適。 技術(shù)角度上,DeepSeek 有下面幾個(gè)亮點(diǎn): · 開(kāi)源:開(kāi)源這點(diǎn)很重要,OpenAI 從 GPT-3 開(kāi)始轉(zhuǎn)為閉源公司后,第一梯隊(duì)三巨頭就不再公開(kāi)技術(shù)細(xì)節(jié),拱手讓出了一個(gè)空白的開(kāi)源生態(tài)位,但 Meta 和 Mistral 并沒(méi)有接穩(wěn)這個(gè)位置,DeepSeek 這次堪稱奇襲,在開(kāi)源這塊大賽道一馬平川。 如果把轟動(dòng)性打 100 分,智能提升貢獻(xiàn) 30 分,開(kāi)源貢獻(xiàn) 70 分,之前 LLaMA 也開(kāi)源但沒(méi)有這么轟動(dòng)的效果,說(shuō)明 LLaMa 智能水平不夠。 · 便宜:“Your margin is my opportunity” 這句話的含金量還在上升。 · 聯(lián)網(wǎng)+公開(kāi) CoT:對(duì)于用戶這兩個(gè)點(diǎn)分別都能帶來(lái)很好的用戶體驗(yàn),DeepSeek 把兩張牌同時(shí)出了,可以說(shuō)是王炸,給到 C 端用戶的體驗(yàn)和其他 Chatbot 完全不一樣。尤其是 CoT 透明,把模型思考過(guò)程公開(kāi)了,透明能讓用戶對(duì) AI 更信任,促進(jìn)了破圈。不過(guò),按理說(shuō) Perplexity 也是沖擊很大的,但 DeepSeek 服務(wù)端不穩(wěn)定,Perplexity 團(tuán)隊(duì)快速反應(yīng)上線了 R-1 反而承接了很大 DeepSeek R-1 溢出的用戶。 · RL 泛化:雖然 RL 是 OpenAI o1 最先提出來(lái)的,但因?yàn)楦鞣N運(yùn)營(yíng)一直半遮半掩,滲透率并不高,DeepSeek R-1 很大意義推動(dòng)了 reasoning model 范式的進(jìn)程,生態(tài)接受度大幅提升。 DeepSeek 在技術(shù)上的探索投入是被這個(gè)智能成果值得更多人關(guān)注、討論的確定性因素,但 DeepSeek R1 推出的 timing 又讓這場(chǎng)轟動(dòng)帶有偶發(fā)性: · 過(guò)去美國(guó)一直講自己在基礎(chǔ)技術(shù)研究上大幅領(lǐng)先,但 DeepSeek 原生于中國(guó)國(guó)內(nèi),這本身也是一個(gè)亮點(diǎn),這個(gè)過(guò)程中,又有很多美國(guó)科技大佬開(kāi)始去宣揚(yáng) DeepSeek 挑戰(zhàn)了美國(guó)科技霸主的地位的論調(diào),DeepSeek 屬于被動(dòng)卷進(jìn)輿論戰(zhàn); · DeepSeek R1 發(fā)布之前,OpenAI Stargate $500B 事件剛剛開(kāi)始發(fā)酵,這種巨量投入和 DeepSeek 團(tuán)隊(duì)智能產(chǎn)出效率對(duì)比太鮮明了,很難不引發(fā)關(guān)注、討論; · DeepSeek 讓英偉達(dá)股價(jià)大跌又進(jìn)一步讓輿論發(fā)酵,他們肯定也想不到自己成為了 2025 開(kāi)年美股第一只黑天鵝; · 春節(jié)是產(chǎn)品的練兵場(chǎng),移動(dòng)互聯(lián)網(wǎng)時(shí)代很多超級(jí) App 都是在春節(jié)大爆發(fā)的,AI 時(shí)代也不例外。DeepSeek R1 恰好在春節(jié)前發(fā)布,大眾驚喜的是它的文字創(chuàng)作能力,而不是訓(xùn)練時(shí)候強(qiáng)調(diào)的 coding 和數(shù)學(xué)能力,文創(chuàng)更容易被大眾用戶有體感,也更容易 go viral。 Insight 05 誰(shuí)受傷?誰(shuí)受益? 可以把這個(gè)賽場(chǎng)上的 players 分 3 類:ToC、To Developer 以及 To Enterprise( to Government): 1. ToC:Chatbot 肯定受沖擊最大,心智和品牌關(guān)注度被 DeepSeek 搶走了,ChatGPT 也不例外; 2. 在開(kāi)發(fā)者環(huán)節(jié)的影響很有限,我們看到有用戶用完之后說(shuō)評(píng)論 r1 不好用不如 sonnet,Cursor 官方也說(shuō) Sonnet 還是 outperform,用戶 surprisingly 高比例都選擇 Sonnet,并沒(méi)有大幅遷移; 3. 第三個(gè)維度,To Enterprise 和 To Government 的生意在于信任和需求理解,大型組織做決策的利益考慮很復(fù)雜,不會(huì)像 C 端用戶那么容易遷移。 再換個(gè)角度,從閉源、開(kāi)源和算力的視角想這個(gè)問(wèn)題: 短期大家會(huì)覺(jué)得閉源的 OpenAI/Anthropic/Google 更受沖擊: · 技術(shù)神秘感被開(kāi)源了,AI hype 里面最重要的神秘感的溢價(jià)被打破; · 更現(xiàn)實(shí)的因素,市場(chǎng)認(rèn)為這幾家閉源公司的潛在客戶和市場(chǎng)規(guī)模被搶走了一些,GPU 投入的回本周期變長(zhǎng); · 作為領(lǐng)頭羊的 OpenAI 在其中屬于最“吃虧”的那個(gè),之前想捂著技術(shù)不開(kāi)源,半遮半掩,希望多賺技術(shù)溢價(jià)的美夢(mèng)無(wú)法實(shí)現(xiàn)了。 但中長(zhǎng)期看,GPU 資源充裕的公司還是受益的,一方面是第二梯隊(duì)的 Meta 可以快速跟進(jìn)新方法,Capex 更加 efficient,Meta 可能是很大受益者,另一方面是智能提升還需要更多探索,DeepSeek 開(kāi)源把大家水平拉齊,進(jìn)入全新探索又需要 10 倍甚至更大量級(jí)的 GPU 投入。 從第一性原理來(lái)想,對(duì)于 AI 智能產(chǎn)業(yè)來(lái)說(shuō),無(wú)論是發(fā)展智能還是應(yīng)用智能,從物理本質(zhì)上就必然要消耗海量算力,這是基礎(chǔ)定律決定的,不是技術(shù)優(yōu)化能完全規(guī)避的。 所以,無(wú)論是探索智能,還是應(yīng)用智能,即便短期有質(zhì)疑,中長(zhǎng)期的算力需求也會(huì)爆炸,這也解釋了為什么馬斯克從第一性原理出發(fā),xAI 堅(jiān)持?jǐn)U建集群,xAI 和 Stargate 背后的深層邏輯也許是一樣的。Amazon 等云廠商都宣布了要增加 Capex 指引。 我們就假設(shè)全球的 AI research 人才水平和認(rèn)知都拉齊,有更多 GPU 就可以做更多實(shí)驗(yàn)探索?最后可能還是回到 compute 的競(jìng)爭(zhēng)。 DeepSeek 光腳不怕穿鞋,沒(méi)有商業(yè)化訴求,專注 AGI 智能技術(shù)探索,開(kāi)源這個(gè)動(dòng)作對(duì)推動(dòng) AGI 進(jìn)程推動(dòng)意義很大,加劇了競(jìng)爭(zhēng),推動(dòng)了開(kāi)放性,頗有鯰魚(yú)效應(yīng)。 Insight 06 蒸餾能超越 SOTA 嗎? 有個(gè)細(xì)節(jié)點(diǎn)不確定,如果 DeepSeek 從 pre train 階段就大量使用蒸餾的 CoT 數(shù)據(jù),那做到今天效果不算驚艷,還是在第一梯隊(duì)巨頭的肩膀上獲得的基礎(chǔ)智能,然后再開(kāi)源出來(lái);但如果 pre train 階段沒(méi)有大量用蒸餾數(shù)據(jù),DeepSeek 從 0 做 pre train 做到今天的效果,那就堪稱驚艷了。 另外,蒸餾能否在 base model 超越 SOTA,應(yīng)該是不太可能的。但 DeepSeek R-1 非常強(qiáng),猜測(cè)是 Reward model 做的非常好,如果 R-1 Zero 這條路徑靠譜,是有機(jī)會(huì)超越 SOTA。 Insight 07 No Moat ! Google 之前對(duì) OpenAI 的一個(gè)評(píng)價(jià):No Moat!這句話放在這里也很應(yīng)景。 ![]() DeepSeek 這一波 Chatbot 用戶又出現(xiàn)了大量遷移現(xiàn)象,給了市場(chǎng)一個(gè)很重要的啟發(fā):智能技術(shù)進(jìn)步非常陡峭,階段性產(chǎn)品很難形成絕對(duì)壁壘。 不管是 ChatGPT/Sonnet/Perplexity 剛形成了心智和口碑,還是 Cursor、Windsurf 這類開(kāi)發(fā)者工具,一旦有了更智能的產(chǎn)品,用戶對(duì)“上一代”智能的產(chǎn)品毫無(wú)忠誠(chéng)度,今天不管是模型層還是應(yīng)用層都很難構(gòu)建護(hù)城河。 DeepSeek 這次也驗(yàn)證了一件事:模型即應(yīng)用,DeepSeek 在產(chǎn)品形式上沒(méi)任何創(chuàng)新,核心就是智能+開(kāi)源,我也不禁思考:在 AI 時(shí)代,任何產(chǎn)品和商業(yè)模式的創(chuàng)新都比不上智能的創(chuàng)新嗎? Insight 08 DeepSeek 應(yīng)該承接 這波 Chatbot 流量并做大嗎? 從 Chatbot 爆火到今天,通過(guò) DeepSeek 團(tuán)隊(duì)的反應(yīng)可以明顯感覺(jué)出來(lái),DeepSeek 還沒(méi)想好怎么用這波流量。 而要不要接住、并積極運(yùn)營(yíng)這批流量這個(gè)問(wèn)題的本質(zhì)是,偉大的商業(yè)公司和偉大的 research lab 能共存在一個(gè)組織嗎? 這件事非??简?yàn)精力和資源分配、組織能力和戰(zhàn)略選擇,如果是字節(jié)、Meta 這類大公司,他們的第一反應(yīng)應(yīng)該都要接下來(lái),也有一定組織基礎(chǔ)可以接下來(lái),但 DeepSeek 作為一個(gè) research lab 組織,承接這波巨量流量的壓力必然很大。 但同時(shí)也要想這一波 Chatbot 會(huì)是階段性流量嗎?Chatbot 是不是在未來(lái)智能探索的主線下?似乎感覺(jué)每個(gè)智能階段都有對(duì)應(yīng)的產(chǎn)品形態(tài),而 Chatbot 只是解鎖的其中一個(gè)早期形態(tài)。 對(duì)于 DeepSeek 來(lái)說(shuō),從未來(lái) 3-5 年視角看,如果今天不去承接 Chatbot 流量,會(huì)不會(huì)是一種 miss?萬(wàn)一哪天跑出規(guī)模效應(yīng)?如果 AGI 最終實(shí)現(xiàn)了,又會(huì)是什么載體來(lái)承接? Insight 09 下一個(gè)智能突破的 Aha moment 從哪來(lái)? 一方面,第一梯隊(duì)的下一代模型很關(guān)鍵,但今天我們又處在 Transformer 的極限邊界上,第一梯隊(duì)能否拿出代際提升的模型也不確定。OpenAI、Anthropic 和 Google 作為回應(yīng)發(fā)出來(lái)好 30-50%的模型可能都不夠挽回局勢(shì),因?yàn)樗麄冑Y源多了 10-30 倍。 另一方面, Agent 落地比較關(guān)鍵,因?yàn)?Agent 需要做長(zhǎng)距離多步驟推理,如果模型好 5-10%,領(lǐng)先的效果就會(huì)被放大很多倍,所以 OpenAI、Anthropic 和 Google 一方面要做 Agent 產(chǎn)品落地,full stack 集成模型+Agent 產(chǎn)品,就像 Windows+Office,二是也要 show 出來(lái)更強(qiáng)大的模型,比如 O3 完整版、Sonnet 4/3.5 opus 為代表的下一代模型。 在技術(shù)不確定性下,最寶貴的是天才 AI researchers,任何想要探索 AGI 的組織都要投入資源更激進(jìn)的 bet on next paradigm,尤其是在今天 pre training 階段已經(jīng)被拉齊的背景下,要有好的人才+充裕資源,探索下一個(gè)智能涌現(xiàn)的 Aha moment。 Insight 10 DeepSeek 這一波讓我對(duì) 中國(guó) AI 人才更有信心,非常鼓舞 最后,希望技術(shù)無(wú)國(guó)界。 ![]() 排版:楊樂(lè)樂(lè) |
|
來(lái)自: 長(zhǎng)沙7喜 > 《AI有關(guān)》