2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色

分享

對(duì) DeepSeek 和智能下半場(chǎng)的幾條判斷

 長(zhǎng)沙7喜 2025-02-08 發(fā)布于湖南
圖片

作者:李廣密

編輯:penny,Siqi

圖片

從 24Q3 開(kāi)始我們就一直在講 AI 的下半場(chǎng),雖然 OpenAI o1 提出了 RL 敘事,但因?yàn)楦鞣N原因沒(méi)有破圈,DeepSeek R1 解了 RL 的謎題,推進(jìn)整個(gè)行業(yè)進(jìn)入了新范式,真正進(jìn)入智能下半場(chǎng)。

市場(chǎng)上關(guān)于 DeepSeek 是什么、為什么的討論已經(jīng)很多了,接下來(lái)更有價(jià)值討論是 AI race 要怎么 play ?把過(guò)去半個(gè)月的思考總結(jié)了一下,希望成為探索下半場(chǎng)的 road map,每隔一段時(shí)間來(lái)復(fù)盤。也列出了幾個(gè)最好奇的問(wèn)題,歡迎填寫問(wèn)卷一起交換想法,我們會(huì)圍繞下一個(gè)智能突破的 Aha moment 組織一場(chǎng)小范圍討論會(huì):

· 下一個(gè)智能突破的 Aha moment 會(huì)從哪出現(xiàn)?

· 如果你有充裕的探索資源,你會(huì)把探索資源投入在什么方向上?

· 比如下一代 Transformer 架構(gòu)、合成數(shù)據(jù)的突破、Online Learning 更高效率的學(xué)習(xí)方式,你會(huì)有哪些 Bet?

Insight 01

DeepSeek 超越 OpenAI 了嗎?

DeepSeek 超越了 Meta Llama 毫無(wú)疑問(wèn),但相比 OpenAI、Anthropic 和 Google 這些第一梯隊(duì) players 還有距離,比如 Gemini 2.0 Flash 成本比 DeepSeek 更低,能力也很強(qiáng),且全模態(tài),外界低估了 Gemini 2.0 為代表的第一梯隊(duì)的能力,只是沒(méi)有開(kāi)源而獲得這么炸裂轟動(dòng)性的效果。

DeepSeek 很讓人興奮,但還不能稱作范式級(jí)創(chuàng)新,更準(zhǔn)確的表述是將之前 OpenAI o1 半遮半掩的范式開(kāi)源,將整個(gè)生態(tài)推向很高滲透率。

從第一性原理角度,在 Transformer 這一代架構(gòu)下超越第一梯隊(duì)模型廠商是有難度的,同樣路徑下很難實(shí)現(xiàn)彎道超車可能,今天更期待有人能探索出下一代的智能架構(gòu)和范式。

圖片

DeepSeek 用一年時(shí)間

追上了 OpenAI 和 Anthropic

Insight 02

DeepSeek 開(kāi)啟新范式了嗎?

就像前面說(shuō)的,嚴(yán)格意義上說(shuō),DeepSeek 沒(méi)有發(fā)明新范式。

但 DeepSeek 的重要意義在于幫助 RL 和 test time compute 這個(gè)新范式真正出圈。如果說(shuō) OpenAI 最初發(fā)布的 o1 是給行業(yè)出了一個(gè)謎語(yǔ),DeepSeek 就是第一個(gè)公開(kāi)解謎的人。

DeepSeek 發(fā)布 R1 和 R1-zero 之前,行業(yè)只有少部分人在實(shí)踐 RL 和 reasoning model,但 DeepSeek 給大家指明了路線圖,讓行業(yè)相信這樣做真的能提升智能,這對(duì)提升信心,吸引更多 AI researcher 轉(zhuǎn)向新范式的研究有巨大的幫助。

有人才進(jìn)入,才有算法創(chuàng)新,有開(kāi)源緊追才有更多計(jì)算資源投入。在 DeepSeek 之后,原本計(jì)劃不再發(fā)新模型的 OpenAI 接連發(fā)出 o3mini,并計(jì)劃繼續(xù)發(fā)布 o3,還考慮開(kāi)源模型。Anthropic 和 Google 也會(huì)加快 RL 的研究。行業(yè)對(duì)新范式的推進(jìn)因?yàn)?DeepSeek 加快,中小團(tuán)隊(duì)也可以在不同的 domain 上嘗試 RL。

另外,reasoning model 的提升會(huì)進(jìn)一步幫助 agent 落地,AI researcher 現(xiàn)在都因此對(duì) agent 的研究和探索更有信心,因此也可以說(shuō) DeepSeek 開(kāi)源 reasoning model 推進(jìn)了行業(yè)向 Agent 的進(jìn)一步探索。

所以 DeepSeek 雖然沒(méi)有發(fā)明新范式,但推進(jìn)整個(gè)行業(yè)進(jìn)入了新范式。

Insight 03

Anthropic 的技術(shù)路線和 R1 有什么不同?

從 Dario的訪談可以看出,Anthropic對(duì)R-1/reasoning model的理解,與O系列有些分歧,Dario覺(jué)得 base model 與 reasoning model應(yīng)該是個(gè)連續(xù)光譜,而非 OpenAI 這種獨(dú)立的模型系列。如果只做 O 系列會(huì)很快遇到天花板。

我一直想為什么 Sonnet 3.5的coding、reasoning 和 agentic能力一下子提升這么強(qiáng),但 4o 一直沒(méi)追上?

他們?cè)?pre training base model 階段就做了大量 RL 工作,核心還是把 base model 提上去,不然只靠 RL 提升 reasoning model 可能很容易把收益吃光。

Insight 04

DeepSeek 的轟動(dòng)有必然,也有偶然

兩位早期 OpenAI 研究員寫的《為什么偉大不能被計(jì)劃》形容 DeepSeek 也很合適

技術(shù)角度上,DeepSeek 有下面幾個(gè)亮點(diǎn):

· 開(kāi)源:開(kāi)源這點(diǎn)很重要,OpenAI 從 GPT-3 開(kāi)始轉(zhuǎn)為閉源公司后,第一梯隊(duì)三巨頭就不再公開(kāi)技術(shù)細(xì)節(jié),拱手讓出了一個(gè)空白的開(kāi)源生態(tài)位,但 Meta 和 Mistral 并沒(méi)有接穩(wěn)這個(gè)位置,DeepSeek 這次堪稱奇襲,在開(kāi)源這塊大賽道一馬平川。

如果把轟動(dòng)性打 100 分,智能提升貢獻(xiàn) 30 分,開(kāi)源貢獻(xiàn) 70 分,之前 LLaMA 也開(kāi)源但沒(méi)有這么轟動(dòng)的效果,說(shuō)明 LLaMa 智能水平不夠。

· 便宜:“Your margin is my opportunity” 這句話的含金量還在上升。

· 聯(lián)網(wǎng)+公開(kāi) CoT:對(duì)于用戶這兩個(gè)點(diǎn)分別都能帶來(lái)很好的用戶體驗(yàn),DeepSeek 把兩張牌同時(shí)出了,可以說(shuō)是王炸,給到 C 端用戶的體驗(yàn)和其他 Chatbot 完全不一樣。尤其是 CoT 透明,把模型思考過(guò)程公開(kāi)了,透明能讓用戶對(duì) AI 更信任,促進(jìn)了破圈。不過(guò),按理說(shuō) Perplexity 也是沖擊很大的,但 DeepSeek 服務(wù)端不穩(wěn)定,Perplexity 團(tuán)隊(duì)快速反應(yīng)上線了 R-1 反而承接了很大 DeepSeek R-1 溢出的用戶。

· RL 泛化:雖然 RL 是 OpenAI o1 最先提出來(lái)的,但因?yàn)楦鞣N運(yùn)營(yíng)一直半遮半掩,滲透率并不高,DeepSeek R-1 很大意義推動(dòng)了 reasoning model 范式的進(jìn)程,生態(tài)接受度大幅提升。

DeepSeek 在技術(shù)上的探索投入是被這個(gè)智能成果值得更多人關(guān)注、討論的確定性因素,但 DeepSeek R1 推出的 timing 又讓這場(chǎng)轟動(dòng)帶有偶發(fā)性:

· 過(guò)去美國(guó)一直講自己在基礎(chǔ)技術(shù)研究上大幅領(lǐng)先,但 DeepSeek 原生于中國(guó)國(guó)內(nèi),這本身也是一個(gè)亮點(diǎn),這個(gè)過(guò)程中,又有很多美國(guó)科技大佬開(kāi)始去宣揚(yáng) DeepSeek 挑戰(zhàn)了美國(guó)科技霸主的地位的論調(diào),DeepSeek 屬于被動(dòng)卷進(jìn)輿論戰(zhàn);

· DeepSeek R1 發(fā)布之前,OpenAI Stargate $500B 事件剛剛開(kāi)始發(fā)酵,這種巨量投入和 DeepSeek 團(tuán)隊(duì)智能產(chǎn)出效率對(duì)比太鮮明了,很難不引發(fā)關(guān)注、討論;

· DeepSeek 讓英偉達(dá)股價(jià)大跌又進(jìn)一步讓輿論發(fā)酵,他們肯定也想不到自己成為了 2025 開(kāi)年美股第一只黑天鵝;

· 春節(jié)是產(chǎn)品的練兵場(chǎng),移動(dòng)互聯(lián)網(wǎng)時(shí)代很多超級(jí) App 都是在春節(jié)大爆發(fā)的,AI 時(shí)代也不例外。DeepSeek R1 恰好在春節(jié)前發(fā)布,大眾驚喜的是它的文字創(chuàng)作能力,而不是訓(xùn)練時(shí)候強(qiáng)調(diào)的 coding 和數(shù)學(xué)能力,文創(chuàng)更容易被大眾用戶有體感,也更容易 go viral。

Insight 05

誰(shuí)受傷?誰(shuí)受益?

可以把這個(gè)賽場(chǎng)上的 players 分 3 類:ToC、To Developer 以及 To Enterprise( to Government):

1. ToC:Chatbot 肯定受沖擊最大,心智和品牌關(guān)注度被 DeepSeek 搶走了,ChatGPT 也不例外;

2. 在開(kāi)發(fā)者環(huán)節(jié)的影響很有限,我們看到有用戶用完之后說(shuō)評(píng)論 r1 不好用不如 sonnet,Cursor 官方也說(shuō) Sonnet 還是 outperform,用戶 surprisingly 高比例都選擇 Sonnet,并沒(méi)有大幅遷移;

3. 第三個(gè)維度,To Enterprise 和 To Government 的生意在于信任和需求理解,大型組織做決策的利益考慮很復(fù)雜,不會(huì)像 C 端用戶那么容易遷移。

再換個(gè)角度,從閉源、開(kāi)源和算力的視角想這個(gè)問(wèn)題:

短期大家會(huì)覺(jué)得閉源的 OpenAI/Anthropic/Google 更受沖擊:

· 技術(shù)神秘感被開(kāi)源了,AI hype 里面最重要的神秘感的溢價(jià)被打破;

· 更現(xiàn)實(shí)的因素,市場(chǎng)認(rèn)為這幾家閉源公司的潛在客戶和市場(chǎng)規(guī)模被搶走了一些,GPU 投入的回本周期變長(zhǎng);

· 作為領(lǐng)頭羊的 OpenAI 在其中屬于最“吃虧”的那個(gè),之前想捂著技術(shù)不開(kāi)源,半遮半掩,希望多賺技術(shù)溢價(jià)的美夢(mèng)無(wú)法實(shí)現(xiàn)了。

但中長(zhǎng)期看,GPU 資源充裕的公司還是受益的,一方面是第二梯隊(duì)的 Meta 可以快速跟進(jìn)新方法,Capex 更加 efficient,Meta 可能是很大受益者,另一方面是智能提升還需要更多探索,DeepSeek 開(kāi)源把大家水平拉齊,進(jìn)入全新探索又需要 10 倍甚至更大量級(jí)的 GPU 投入。

從第一性原理來(lái)想,對(duì)于 AI 智能產(chǎn)業(yè)來(lái)說(shuō),無(wú)論是發(fā)展智能還是應(yīng)用智能,從物理本質(zhì)上就必然要消耗海量算力,這是基礎(chǔ)定律決定的,不是技術(shù)優(yōu)化能完全規(guī)避的。

所以,無(wú)論是探索智能,還是應(yīng)用智能,即便短期有質(zhì)疑,中長(zhǎng)期的算力需求也會(huì)爆炸,這也解釋了為什么馬斯克從第一性原理出發(fā),xAI 堅(jiān)持?jǐn)U建集群,xAI 和 Stargate 背后的深層邏輯也許是一樣的。Amazon 等云廠商都宣布了要增加 Capex 指引。

我們就假設(shè)全球的 AI research 人才水平和認(rèn)知都拉齊,有更多 GPU 就可以做更多實(shí)驗(yàn)探索?最后可能還是回到 compute 的競(jìng)爭(zhēng)。

DeepSeek 光腳不怕穿鞋,沒(méi)有商業(yè)化訴求,專注 AGI 智能技術(shù)探索,開(kāi)源這個(gè)動(dòng)作對(duì)推動(dòng) AGI 進(jìn)程推動(dòng)意義很大,加劇了競(jìng)爭(zhēng),推動(dòng)了開(kāi)放性,頗有鯰魚(yú)效應(yīng)。

Insight 06

蒸餾能超越 SOTA 嗎?

有個(gè)細(xì)節(jié)點(diǎn)不確定,如果 DeepSeek 從 pre train 階段就大量使用蒸餾的 CoT 數(shù)據(jù),那做到今天效果不算驚艷,還是在第一梯隊(duì)巨頭的肩膀上獲得的基礎(chǔ)智能,然后再開(kāi)源出來(lái);但如果 pre train 階段沒(méi)有大量用蒸餾數(shù)據(jù),DeepSeek 從 0 做 pre train 做到今天的效果,那就堪稱驚艷了。

另外,蒸餾能否在 base model 超越 SOTA,應(yīng)該是不太可能的。但 DeepSeek R-1 非常強(qiáng),猜測(cè)是 Reward model 做的非常好,如果 R-1 Zero 這條路徑靠譜,是有機(jī)會(huì)超越 SOTA。

Insight 07

No Moat ! 

Google 之前對(duì) OpenAI 的一個(gè)評(píng)價(jià):No Moat!這句話放在這里也很應(yīng)景。

圖片

DeepSeek 這一波  Chatbot 用戶又出現(xiàn)了大量遷移現(xiàn)象,給了市場(chǎng)一個(gè)很重要的啟發(fā):智能技術(shù)進(jìn)步非常陡峭,階段性產(chǎn)品很難形成絕對(duì)壁壘。

不管是 ChatGPT/Sonnet/Perplexity 剛形成了心智和口碑,還是 Cursor、Windsurf 這類開(kāi)發(fā)者工具,一旦有了更智能的產(chǎn)品,用戶對(duì)“上一代”智能的產(chǎn)品毫無(wú)忠誠(chéng)度,今天不管是模型層還是應(yīng)用層都很難構(gòu)建護(hù)城河。

DeepSeek 這次也驗(yàn)證了一件事:模型即應(yīng)用,DeepSeek 在產(chǎn)品形式上沒(méi)任何創(chuàng)新,核心就是智能+開(kāi)源,我也不禁思考:在 AI 時(shí)代,任何產(chǎn)品和商業(yè)模式的創(chuàng)新都比不上智能的創(chuàng)新嗎?

Insight 08

DeepSeek 應(yīng)該承接

這波 Chatbot 流量并做大嗎?

從 Chatbot 爆火到今天,通過(guò) DeepSeek 團(tuán)隊(duì)的反應(yīng)可以明顯感覺(jué)出來(lái),DeepSeek 還沒(méi)想好怎么用這波流量。

而要不要接住、并積極運(yùn)營(yíng)這批流量這個(gè)問(wèn)題的本質(zhì)是,偉大的商業(yè)公司和偉大的 research lab 能共存在一個(gè)組織嗎?

這件事非??简?yàn)精力和資源分配、組織能力和戰(zhàn)略選擇,如果是字節(jié)、Meta 這類大公司,他們的第一反應(yīng)應(yīng)該都要接下來(lái),也有一定組織基礎(chǔ)可以接下來(lái),但 DeepSeek 作為一個(gè) research lab 組織,承接這波巨量流量的壓力必然很大。

但同時(shí)也要想這一波 Chatbot 會(huì)是階段性流量嗎?Chatbot 是不是在未來(lái)智能探索的主線下?似乎感覺(jué)每個(gè)智能階段都有對(duì)應(yīng)的產(chǎn)品形態(tài),而 Chatbot 只是解鎖的其中一個(gè)早期形態(tài)。

對(duì)于 DeepSeek 來(lái)說(shuō),從未來(lái) 3-5 年視角看,如果今天不去承接 Chatbot 流量,會(huì)不會(huì)是一種 miss?萬(wàn)一哪天跑出規(guī)模效應(yīng)?如果 AGI 最終實(shí)現(xiàn)了,又會(huì)是什么載體來(lái)承接?

Insight 09

下一個(gè)智能突破的 Aha moment 從哪來(lái)?

一方面,第一梯隊(duì)的下一代模型很關(guān)鍵,但今天我們又處在 Transformer 的極限邊界上,第一梯隊(duì)能否拿出代際提升的模型也不確定。OpenAI、Anthropic 和 Google 作為回應(yīng)發(fā)出來(lái)好 30-50%的模型可能都不夠挽回局勢(shì),因?yàn)樗麄冑Y源多了 10-30 倍。

另一方面, Agent 落地比較關(guān)鍵,因?yàn)?Agent 需要做長(zhǎng)距離多步驟推理,如果模型好 5-10%,領(lǐng)先的效果就會(huì)被放大很多倍,所以 OpenAI、Anthropic 和 Google 一方面要做 Agent 產(chǎn)品落地,full stack 集成模型+Agent 產(chǎn)品,就像 Windows+Office,二是也要 show 出來(lái)更強(qiáng)大的模型,比如 O3 完整版、Sonnet 4/3.5 opus 為代表的下一代模型。

在技術(shù)不確定性下,最寶貴的是天才 AI researchers,任何想要探索 AGI 的組織都要投入資源更激進(jìn)的 bet on next paradigm,尤其是在今天 pre training 階段已經(jīng)被拉齊的背景下,要有好的人才+充裕資源,探索下一個(gè)智能涌現(xiàn)的 Aha moment。

Insight 10

DeepSeek 這一波讓我對(duì)

中國(guó) AI 人才更有信心,非常鼓舞

最后,希望技術(shù)無(wú)國(guó)界。

圖片

排版:楊樂(lè)樂(lè)

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多