2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色

分享

不吹不黑:關(guān)于DeepSeek的高級(jí)別會(huì)議紀(jì)要

 mrjiangkai 2025-01-31

DeepSeek-R1在全球AI界引發(fā)轟動(dòng),但關(guān)于DeepSeek的高質(zhì)量信息相對(duì)匱乏。

2025年1月26日,拾象創(chuàng)始人兼CEO李廣密組織了一場(chǎng)關(guān)于DeepSeek的閉門討論,數(shù)十位頂尖AI研究者、投資人和一線AI從業(yè)者齊聚一堂,共同探討并學(xué)習(xí)DeepSeek的技術(shù)細(xì)節(jié)、組織文化,以及其進(jìn)入全球市場(chǎng)帶來的短期、中期和長期影響。這次討論試圖揭開這支'神秘的東方力量'的面紗。

這場(chǎng)討論不僅是對(duì)DeepSeek現(xiàn)象的解讀,更是對(duì)AI產(chǎn)業(yè)未來走向的一次集體洞察。通過深入分析與交叉驗(yàn)證,我們可以提煉出幾個(gè)關(guān)鍵洞見:

范式轉(zhuǎn)變

DeepSeek的崛起代表了一種新的技術(shù)發(fā)展范式 —— '效率優(yōu)先'取代'規(guī)模至上'。這不僅是計(jì)算資源約束下的被動(dòng)選擇,更是對(duì)AI發(fā)展本質(zhì)的重新思考。就像量子計(jì)算從'增加量子比特?cái)?shù)量'轉(zhuǎn)向'提高量子相干性',AI或許也正在經(jīng)歷從'擴(kuò)張'到'精進(jìn)'的質(zhì)變。

技術(shù)路線的分化

一個(gè)可能的趨勢(shì):AI技術(shù)路線正在進(jìn)入分化期。這種分化不是傳統(tǒng)意義上的'領(lǐng)先-跟隨'模式,而是形成了多個(gè)各具特色的技術(shù)路徑:

- 算力密集型:以O(shè)penAI為代表

- 效率導(dǎo)向型:以DeepSeek為代表

- 專業(yè)垂直型:智譜的醫(yī)療大模型

這種分化預(yù)示著AI行業(yè)可能進(jìn)入類似操作系統(tǒng)時(shí)代的'Unix分支'階段。

商業(yè)模式重構(gòu)

會(huì)議討論暴露出一個(gè)關(guān)鍵問題:當(dāng)前AI行業(yè)的商業(yè)模式正面臨重構(gòu)。DeepSeek以量化交易作為商業(yè)基礎(chǔ)的模式,暗示了AI公司可能需要找到一個(gè)'造血'業(yè)務(wù)來支撐長期研發(fā)。這種模式或?qū)⒅厮苷麄€(gè)AI產(chǎn)業(yè)的投資邏輯。

高智力密度的人才模式

在一個(gè)快速迭代的領(lǐng)域,經(jīng)驗(yàn)的價(jià)值可能不及創(chuàng)新思維的重要性。這種觀點(diǎn)與貝爾實(shí)驗(yàn)室早期的人才策略異曲同工,都強(qiáng)調(diào)在新范式下培養(yǎng)'原生'人才的重要性。

全球競(jìng)爭(zhēng)新維度

當(dāng)前的AI競(jìng)爭(zhēng)不僅是中美AI競(jìng)爭(zhēng),全球AI競(jìng)爭(zhēng)可能進(jìn)入'多中心化'階段。當(dāng)技術(shù)門檻從算力轉(zhuǎn)向效率,競(jìng)爭(zhēng)優(yōu)勢(shì)的來源將更加多元,這可能導(dǎo)致更多區(qū)域性AI中心的出現(xiàn)。

未來的關(guān)鍵挑戰(zhàn)

縱觀整場(chǎng)討論,我們可以預(yù)見幾個(gè)關(guān)鍵挑戰(zhàn):

- 效率與創(chuàng)新的平衡:如何在追求效率的同時(shí)保持突破性創(chuàng)新

- 開源與閉源的博弈:商業(yè)模式與技術(shù)創(chuàng)新的新均衡

- 算力約束下的突破:在有限資源條件下實(shí)現(xiàn)技術(shù)飛躍

小結(jié)

這場(chǎng)討論實(shí)際上告訴我們AI產(chǎn)業(yè)正在經(jīng)歷'第二次浪潮'。第一次浪潮以算力和規(guī)模為特征,而即將到來的第二次浪潮可能以效率和創(chuàng)新為核心。在這個(gè)轉(zhuǎn)折點(diǎn)上,DeepSeek的經(jīng)驗(yàn)既是一個(gè)案例,也是一面鏡子,照見了整個(gè)行業(yè)的演進(jìn)方向。

正如結(jié)尾所言:'愿景勝于技術(shù)',但真正的愿景不僅是看得見的未來,更是看得清的路徑。在AI這個(gè)快速演進(jìn)的領(lǐng)域,找到正確的方向可能比擁有強(qiáng)大的資源更為重要。

附會(huì)議紀(jì)要(翻譯):

神秘的DeepSeek:'推動(dòng)智能才是最重要的'

創(chuàng)始人兼CEO梁文鋒是DeepSeek的核心人物。他與Sam Altman不是同一類型的人,他對(duì)技術(shù)有著深刻的理解。

DeepSeek之所以聲名鵲起,是因?yàn)樗氏劝l(fā)布了可復(fù)現(xiàn)的MoE、o1級(jí)推理模型等成果。它成功在于行動(dòng)早,但是否做到了絕對(duì)最好還有待觀察。展望未來,最大的挑戰(zhàn)在于資源有限,只能投入到最具潛力的領(lǐng)域。DeepSeek的研究實(shí)力和文化依然強(qiáng)勁,如果能獲得10萬或20萬片芯片,他們可能會(huì)做得更好。

從預(yù)覽版到正式發(fā)布,DeepSeek模型的長文本處理能力迅速提升。DeepSeek的20K長文本能力是通過非常傳統(tǒng)的方法實(shí)現(xiàn)的。

Scale.ai的CEO說DeepSeek有5萬片芯片,但這顯然不符合實(shí)際。根據(jù)公開信息,DeepSeek在禁令前有1萬片舊A100芯片,可能還有3000張H800卡。DeepSeek非常注重合規(guī),沒有購買任何不合規(guī)的GPU,所以芯片數(shù)量應(yīng)該不多。美國使用GPU的方式太過奢侈。

DeepSeek將全部精力集中在單一目標(biāo)上,因此放棄了許多其他方向,比如多模態(tài)。DeepSeek不僅僅是為了服務(wù)人類,更是在追求智能本身,這可能是其成功的關(guān)鍵因素之一。

從某種程度上說,量化交易可以被視為DeepSeek的商業(yè)模式?;梅?梁文鋒創(chuàng)立的另一家量化投資公司)是上一輪機(jī)器學(xué)習(xí)浪潮的產(chǎn)物。DeepSeek的首要任務(wù)是推動(dòng)智能發(fā)展。金錢和商業(yè)化并非其優(yōu)先考慮。中國需要幾個(gè)能夠超越OpenAI的領(lǐng)先AI實(shí)驗(yàn)室。智能的發(fā)展需要很長時(shí)間,今年已經(jīng)開始出現(xiàn)新的分化,因此必然會(huì)產(chǎn)生新的創(chuàng)新。

從技術(shù)來看,DeepSeek已經(jīng)成為人才培養(yǎng)的重要基地。

美國AI實(shí)驗(yàn)室的商業(yè)模式也不理想。當(dāng)今AI還沒有好的商業(yè)模式,未來需要可行的解決方案。梁文鋒很有抱負(fù):DeepSeek并不在意模型本身,而是一心向著AGI邁進(jìn)。

DeepSeek論文中的許多見解都涉及如何節(jié)省硬件成本。在幾個(gè)主要的擴(kuò)展維度上,DeepSeek的技術(shù)能夠顯著降低成本。

短期來看,每個(gè)人都會(huì)被驅(qū)使思考如何讓AI更加高效。從長遠(yuǎn)來看,算力問題依然存在。對(duì)算力的需求仍然強(qiáng)勁,沒有哪家公司擁有足夠的算力。

關(guān)于DeepSeek的組織架構(gòu)

在投資時(shí),我們總是選擇最頂尖的人才。但從DeepSeek的模式(團(tuán)隊(duì)主要由國內(nèi)大學(xué)畢業(yè)的聰明年輕人組成)來看,一個(gè)凝聚力強(qiáng)的團(tuán)隊(duì)也可以在共同進(jìn)步中逐步提升技能。目前還無法判斷挖走一個(gè)人是否會(huì)打破DeepSeek的優(yōu)勢(shì),但目前看來這種可能性不大。

盡管市場(chǎng)上資金充裕,但DeepSeek的核心優(yōu)勢(shì)在于其文化。DeepSeek和字節(jié)跳動(dòng)的研究文化相似,這兩種文化對(duì)于確定資金可獲得性和長期生存能力都至關(guān)重要。只有擁有重要的商業(yè)模式,才能維持可持續(xù)的文化。DeepSeek和字節(jié)跳動(dòng)都有非常好的商業(yè)模式。

為什么DeepSeek能夠如此快速地追趕上來?

推理模型需要高質(zhì)量的數(shù)據(jù)和訓(xùn)練。對(duì)于大語言模型或多模態(tài)AI來說,從頭開始追趕閉源模型是很困難的。純推理模型的架構(gòu)變化不大,所以在推理方面更容易追趕。

R1之所以能快速追趕,部分原因在于這項(xiàng)任務(wù)本身并不特別困難。強(qiáng)化學(xué)習(xí)只是讓模型的選擇更準(zhǔn)確。R1并沒有突破Consensus 32的效率,仍然花費(fèi)了32倍的效率,這相當(dāng)于從深度處理轉(zhuǎn)向并行化,并不是在推動(dòng)智能的邊界,只是讓它變得更容易。

先行者與追隨者:'AI進(jìn)展呈階梯函數(shù)——追隨者只需十分之一的算力'

AI的發(fā)展類似于階梯函數(shù),追隨者所需的算力已經(jīng)降低了十倍。追隨者歷來都有較低的算力成本,但探索者仍需要訓(xùn)練許多模型。對(duì)新算法和架構(gòu)的探索不會(huì)停止。在階梯函數(shù)背后,是許多人的巨大投入,這意味著算力投資將繼續(xù)推進(jìn)。大量資源也將分配給產(chǎn)品開發(fā)。除了推理之外,還有其他需要密集計(jì)算的方向。雖然探索者投入的大量算力資源可能并不顯眼,但如果沒有這樣的投入,下一個(gè)'臺(tái)階'可能就不會(huì)出現(xiàn)。此外,許多人對(duì)當(dāng)前的架構(gòu)和強(qiáng)化學(xué)習(xí)方法都不滿意,進(jìn)步仍將繼續(xù)。

在探索方向時(shí),用1萬個(gè)GPU獲得的性能可能并不總是顯著優(yōu)于1000個(gè)GPU,但某個(gè)地方存在著一個(gè)門檻。僅用100個(gè)GPU不太可能取得有意義的結(jié)果,因?yàn)槊總€(gè)解決方案的迭代時(shí)間都太長。

物理學(xué)的進(jìn)步可以分為大學(xué)的學(xué)術(shù)研究和產(chǎn)業(yè)實(shí)驗(yàn)室。前者專注于探索多個(gè)方向而不需要立即回報(bào),后者則優(yōu)先考慮效率提升。

從探索者和追隨者的角度來看,GPU數(shù)量有限的小公司必須優(yōu)先考慮效率,而大公司則專注于盡快實(shí)現(xiàn)模型。在2000個(gè)GPU的集群上提高效率的方法,可能在10000個(gè)GPU的集群上效果不佳,對(duì)后者而言穩(wěn)定性成為更高的優(yōu)先級(jí)。

CUDA生態(tài)系統(tǒng)的優(yōu)勢(shì)在于其廣泛而完整的算子集。華為等中國公司針對(duì)常用算子實(shí)現(xiàn)突破,利用了后發(fā)優(yōu)勢(shì)。如果一家公司擁有10萬個(gè)GPU,在成為領(lǐng)導(dǎo)者還是追隨者之間的選擇至關(guān)重要。成為領(lǐng)導(dǎo)者成本高昂,而追隨者則效率更高。中國接下來要追趕的方向可能是多模態(tài),特別是考慮到GPT-5已經(jīng)推遲了很長時(shí)間。

為什么其他公司沒有采用DeepSeek的方法:'大型實(shí)驗(yàn)室的模型需要保持低調(diào)'

關(guān)于為什么OpenAI和Anthropic沒有朝DeepSeek的方向發(fā)展,這是公司特定關(guān)注點(diǎn)的問題。OpenAI和Anthropic可能認(rèn)為將他們的算力投入到其他領(lǐng)域更有價(jià)值。

DeepSeek成功的一個(gè)假設(shè)是,與大型科技公司不同,DeepSeek沒有涉足多模態(tài),而是專注于語言。大型科技公司的模型能力并不弱,但他們必須保持低調(diào),不能頻繁發(fā)布。目前,多模態(tài)并不是特別關(guān)鍵,因?yàn)橹悄苤饕獊碜哉Z言,多模態(tài)對(duì)提升智能的貢獻(xiàn)并不顯著。

2025年技術(shù)的分歧與押注:'我們能找到超越Transformer的架構(gòu)嗎?'

2025年,模型將開始出現(xiàn)分化。最吸引人的愿景是不斷推動(dòng)智能的邊界,有許多潛在的突破路徑。方法可能會(huì)改變,比如通過合成數(shù)據(jù)或替代架構(gòu)。

2025年首先會(huì)看到對(duì)Transformer之外新架構(gòu)的興趣。一些初步探索已經(jīng)開始,旨在降低成本的同時(shí)推動(dòng)智能的邊界。其次,強(qiáng)化學(xué)習(xí)(RL)的潛力尚未完全發(fā)掘。在產(chǎn)品方面,對(duì)智能體(agents)有很大興趣,盡管它們還未得到廣泛應(yīng)用。

2025年可能會(huì)出現(xiàn)能夠挑戰(zhàn)ChatGPT范式的多模態(tài)產(chǎn)品。

R1和V3在實(shí)現(xiàn)低成本和高性能方面的成功表明這個(gè)方向是可行的。這與擴(kuò)展硬件或增加參數(shù)的方法并不沖突。然而,在中國,由于某些限制,前者是主要選擇。

關(guān)于DeepSeek

首先,DeepSeek可能是被'迫'走上當(dāng)前的基礎(chǔ)模型路徑,或者可能只是在遵循Scaling Law。

其次,從蒸餾的角度來看,DeepSeek可能遵循'large to small'的方法。這對(duì)閉源模型有利,因?yàn)殚]源模型正在變得越來越大。

第三,目前領(lǐng)域內(nèi)還沒有出現(xiàn) anti-scaling metrics。如果出現(xiàn)這樣的指標(biāo),可能會(huì)對(duì)Scaling Law構(gòu)成挑戰(zhàn)。然而,開源模型可以實(shí)現(xiàn)閉源模型所做的一切,同時(shí)還能降低成本,這對(duì)閉源模型也是有利的。

據(jù)報(bào)道,Meta仍在復(fù)現(xiàn)DeepSeek的過程中,但到目前為止,這并未顯著影響他們的基礎(chǔ)設(shè)施或長期路線圖。從長遠(yuǎn)來看,除了探索技術(shù)邊界之外,還必須考慮成本效益。降低成本將讓我們有更多發(fā)展空間。

開發(fā)者是否從閉源模型轉(zhuǎn)向DeepSeek?'還沒有'

開發(fā)者會(huì)從閉源模型遷移到DeepSeek嗎?目前還沒有出現(xiàn)大規(guī)模遷移,因?yàn)轭I(lǐng)先模型在編碼指令遵循方面表現(xiàn)出色,這是一個(gè)重要優(yōu)勢(shì)。然而,這種優(yōu)勢(shì)是否會(huì)持續(xù)存在或被超越還不確定。

從開發(fā)者的角度來看,像Claude-3.5-Sonnet這樣的模型經(jīng)過專門訓(xùn)練用于工具使用,使其非常適合智能體開發(fā)。相比之下,DeepSeek這樣的模型還沒有關(guān)注這個(gè)領(lǐng)域,但DeepSeek的增長潛力巨大。

對(duì)于大模型用戶來說,DeepSeek V2已經(jīng)滿足了大多數(shù)需求。雖然R1提高了速度,但并沒有提供顯著的額外價(jià)值。有趣的是,在進(jìn)行深度推理時(shí),一些以前正確的答案現(xiàn)在反而傾向于出錯(cuò)。

在選擇模型時(shí),用戶傾向于使用工程方法簡(jiǎn)化問題。2025年可能成為應(yīng)用之年,各行業(yè)將利用現(xiàn)有能力。然而,這可能導(dǎo)致瓶頸,因?yàn)榇蠖鄶?shù)日常任務(wù)可能不需要高度智能的模型。

目前,強(qiáng)化學(xué)習(xí)(RL)解決標(biāo)準(zhǔn)答案問題,但尚未取得超越 AlphaZero 的突破。實(shí)際上,它往往更簡(jiǎn)單。蒸餾解決標(biāo)準(zhǔn)答案問題,RL 方法在使用這些答案進(jìn)行訓(xùn)練時(shí)效果很好。這解釋了為什么蒸餾和 RL 在近年來取得了快速進(jìn)展。

人類對(duì)智能的需求被大大低估了。許多關(guān)鍵問題,如癌癥和SpaceX的隔熱材料,仍未解決?,F(xiàn)有的AI主要是自動(dòng)化任務(wù),但前方還有眾多未解決的挑戰(zhàn)。展望未來,爆發(fā)式增長的潛力巨大,智能的進(jìn)步不能停止。

OpenAI Stargate的5000億美元敘事與算力需求的變化

DeepSeek的出現(xiàn)讓人們開始質(zhì)疑 Nvidia 和 OpenAI 最新的5000億美元敘事。關(guān)于算力還沒有定論——OpenAI 的 5000 億美元敘事是他們?cè)噲D給自己一條生路。

關(guān)于對(duì) OpenAI 5000 億美元基礎(chǔ)設(shè)施投資的質(zhì)疑:因?yàn)?OpenAI 是一家商業(yè)公司,如果涉及債務(wù)可能會(huì)有風(fēng)險(xiǎn)。

5000 億美元是一個(gè)極端數(shù)字——可能會(huì)在4到5年內(nèi)執(zhí)行。軟銀和 OpenAI 是主要參與者(前者提供資金,后者提供技術(shù))——但軟銀目前的資金無法支持 5000 億美元;相反,軟銀正在用其資產(chǎn)作為抵押。同時(shí),OpenAI 的現(xiàn)金并不充裕,其他AI公司更多是技術(shù)參與者而非資金提供者。因此,要完全實(shí)現(xiàn)5000億的愿景將是一場(chǎng)艱苦的戰(zhàn)斗。

OpenAI 的 5000 億算力是有道理的:在探索階段,試錯(cuò)成本很高,人力和投資成本都很大。但雖然路徑不清晰,從o1到R1也不容易,至少我們能看到終點(diǎn)線在哪里:我們可以追蹤中間標(biāo)記,從第一天起就瞄準(zhǔn)他人已證實(shí)的終態(tài);這讓我們能更好地把握進(jìn)度。處于前沿探索下一代是最耗費(fèi)資源的。追隨者不承擔(dān)探索成本——他們永遠(yuǎn)只是在跟隨。如果谷歌/Anthropic在他們的探索領(lǐng)域取得成功,他們可能會(huì)成為前沿公司。

未來,Anthropic可能會(huì)用TPU或AWS芯片替換所有推理。

國內(nèi)公司此前受到算力限制,但現(xiàn)在已經(jīng)證明技術(shù)潛力空間很大。對(duì)于更高效的模型,我們可能不需要特別大的顯卡——我們可以提供相對(duì)定制的芯片,可以適配AMD和ASIC。從投資來看,Nvidia的護(hù)城河很高,但ASIC將有更大的機(jī)會(huì)。

DeepSeek的情況并不真的是關(guān)于算力——而是美國意識(shí)到了中國的能力和效率。DeepSeek不是Nvidia的軟肋;只要AI在增長,Nvidia就會(huì)增長。Nvidia的優(yōu)勢(shì)在于其生態(tài)系統(tǒng),這是經(jīng)過長期積累建立起來的。確實(shí),當(dāng)技術(shù)快速發(fā)展時(shí),生態(tài)系統(tǒng)至關(guān)重要。真正的危機(jī)出現(xiàn)在技術(shù)成熟如電力時(shí):它變成商品;然后,每個(gè)人都會(huì)專注于產(chǎn)品,許多ASIC芯片會(huì)出現(xiàn)用于特定場(chǎng)景優(yōu)化。

對(duì)二級(jí)市場(chǎng)的影響:'短期情緒承壓,但長期敘事延續(xù)'

DeepSeek對(duì)美國AI板塊和股價(jià)產(chǎn)生了重大短期影響:預(yù)訓(xùn)練需求增長放緩,而后訓(xùn)練和推理擴(kuò)展還沒有足夠快速擴(kuò)大,為相關(guān)公司的敘事造成了缺口,這將影響短期交易。

DeepSeek主要使用FP8,而美國使用FP16。DeepSeek的改進(jìn)都基于有限的計(jì)算工程能力,高效使用算力是最大亮點(diǎn)。上周五,DeepSeek在北美產(chǎn)生了巨大影響:扎克伯格對(duì)Meta的資本支出給出了更高預(yù)期,但Nvidia和臺(tái)積電下跌,只有博通上漲。

DeepSeek給股價(jià)和估值帶來短期市場(chǎng)情緒壓力。這影響著二級(jí)市場(chǎng)計(jì)算相關(guān)公司,甚至能源公司——但長期敘事將繼續(xù)。

二級(jí)市場(chǎng)從業(yè)者會(huì)擔(dān)心 Nvidia 從H卡到B卡過渡期間可能出現(xiàn)的真空期。加上來自DeepSeek的壓力,將出現(xiàn)短期股價(jià)壓力——但這可能帶來更好的長期機(jī)會(huì)。

這種短期影響反映了對(duì)DeepSeek低成本訓(xùn)練投資的情緒(例如,它直接影響了Nvidia 的股價(jià))。然而,AI是一個(gè)具有巨大潛力的增長市場(chǎng)。從長遠(yuǎn)來看,AI才剛剛開始,如果CUDA仍然是首選,硬件增長潛力仍然巨大。

開源與閉源:'如果能力相似,閉源將陷入困境'

開源與閉源之間的戰(zhàn)斗加劇了人們對(duì)DeepSeek的關(guān)注。

OpenAI和其他公司可能隱藏了他們的好模型,到目前為止還沒有發(fā)布任何領(lǐng)先模型。但在DeepSeek發(fā)布之后,其他AI公司可能無法再隱藏他們的好模型了。

DeepSeek做了大量成本優(yōu)化。亞馬遜等公司沒有看到任何變化,仍在按既定計(jì)劃行事,處于共存狀態(tài)。開源和閉源模型并不矛盾。大學(xué)和小型實(shí)驗(yàn)室應(yīng)該優(yōu)先考慮DeepSeek。云廠商不會(huì)有競(jìng)爭(zhēng),因?yàn)樵茝S商支持開源和閉源,保持著生態(tài)系統(tǒng)當(dāng)前的共存狀態(tài)。DeepSeek的應(yīng)用還沒有Anthropic成熟,如果希望長期得到歐美市場(chǎng)的認(rèn)可,需要在AI安全方面投入大量時(shí)間和資源。

開源控制著整個(gè)市場(chǎng)的利潤率。如果開源能做到閉源95%的事情,而閉源太貴,那么就可以完全使用開源。如果開源和閉源的能力差異不大,這對(duì)閉源來說是一個(gè)巨大的挑戰(zhàn)。

DeepSeek突破的影響:'愿景勝于技術(shù)'

DeepSeek的突破讓外界認(rèn)識(shí)到了中國的AI實(shí)力。此前,外界認(rèn)為中國的AI進(jìn)展落后美國兩年,但DeepSeek表明差距實(shí)際上是3到9個(gè)月,在某些領(lǐng)域甚至更短。

對(duì)于美國歷來阻止中國接觸的技術(shù)和領(lǐng)域,如果中國仍然能夠突破,這些領(lǐng)域最終會(huì)變得高度競(jìng)爭(zhēng)。AI可能會(huì)遵循這種模式——DeepSeek的成功很可能證明了這一點(diǎn)。

DeepSeek并非突然爆發(fā)。R1的令人印象深刻的結(jié)果在美國整個(gè)AI界引起了震動(dòng)。

DeepSeek站在巨人的肩膀上——但探索前沿仍然需要更多的時(shí)間和人力資本成本。R1并不意味著未來的訓(xùn)練成本會(huì)降低。

AI探索者確實(shí)需要更多算力;中國作為追隨者,可以利用其工程優(yōu)勢(shì)。中國大模型團(tuán)隊(duì)如何用更少的算力產(chǎn)生結(jié)果,從而具有一定的韌性——甚至做得更好——可能最終會(huì)成為未來美中AI格局的寫照。

中國仍在復(fù)制技術(shù)解決方案;推理是由 OpenAI 在 o1 中提出的,所以下一個(gè)AI實(shí)驗(yàn)室之間的差距將在于誰能提出下一個(gè)推理。無限長度推理可能是一個(gè)愿景。

不同AI實(shí)驗(yàn)室模型的核心差異不在于技術(shù),而在于每個(gè)實(shí)驗(yàn)室的下一個(gè)愿景是什么。

畢竟,愿景勝于技術(shù)。

原文鏈接:https://www.dia/p/deepseek-the-view-from-china

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多