作者 | 萬(wàn)泉河
編輯 | 阿文
看得見(jiàn)的硝煙
AI少閑月,五月人倍忙。
5月的AI行業(yè)格外熱鬧。國(guó)外,OpenAI、谷歌、微軟相繼發(fā)布了AI在多模態(tài)和端側(cè)應(yīng)用的新產(chǎn)品GPT-4o、Astra和AI PC ,賺足看客眼球的同時(shí),競(jìng)爭(zhēng)的硝煙也在彌漫。
而國(guó)內(nèi),大模型廠商的競(jìng)爭(zhēng)則更直接和露骨,他們沒(méi)有征兆地開(kāi)啟了價(jià)格戰(zhàn)。沒(méi)有鋪墊和試探,降價(jià)幅度堪比蹦極,仿佛置身“618大促”直播間,賣(mài)貨主播聲嘶力竭地喊:“幫家人們把大模型價(jià)格打下來(lái)!”。
很多人認(rèn)為價(jià)格戰(zhàn)的導(dǎo)火索是字節(jié)的豆包大模型降價(jià),其實(shí)并不準(zhǔn)確。真正打響第一槍的是幻方旗下的大模型公司DeepSeek,它于5月6日開(kāi)源了DeepSeek-V2,并將輸入價(jià)格定為1元/百萬(wàn)tokens,僅為GPT-4-Turbo價(jià)格的近百分之一。
隨后智譜AI入局,宣布個(gè)人版GLM-3Turbo模型產(chǎn)品的調(diào)用價(jià)格下調(diào)80%,輸入價(jià)格也定為1元/百萬(wàn)tokens。
接下來(lái),云廠商的加入把戰(zhàn)斗推向高潮,這下整個(gè)“晉西北”正式亂成一鍋粥了。
5月15日,字節(jié)宣布豆包主力模型Doubao-pro-32k輸入價(jià)格定價(jià)0.8元/百萬(wàn)tokens;5月21日,阿里云宣布旗下九款通義大模型全降價(jià),其中對(duì)標(biāo)GPT-4的主力模型Qwen-Long價(jià)格直降97%,來(lái)到了0.5元/百萬(wàn)tokens。
阿里云這邊剛起鍋燒水,百度過(guò)來(lái)就把爐子拆了。通義宣布降價(jià)僅幾小時(shí)后,百度可能懶得算那幾塊幾毛的賬了,直接把兩款文心輕量級(jí)模型ERNIE Speed和ERNIE Lite免費(fèi)了。
百度把調(diào)子起高了,后邊上臺(tái)的選手也只能硬著頭皮唱。5月22日,科大訊飛宣布訊飛星火Lite API調(diào)用免費(fèi);“跟跑大師”騰訊云隨即也宣布旗下混元模型混元-lite免費(fèi)、混元-standard-256k輸入價(jià)格下調(diào)87.5%,降至15元/百萬(wàn)tokens。
透過(guò)現(xiàn)象看本質(zhì),國(guó)內(nèi)外的動(dòng)作雖不相同,但都隱隱指明了當(dāng)下大模型廠商的發(fā)力方向——大模型應(yīng)用的落地。
降價(jià)空間從何而來(lái)?
阿里云智能集團(tuán)資深副總裁劉偉光明確指出,大幅降低大模型推理價(jià)格的目的,在于加速AI應(yīng)用的爆發(fā)。
從行業(yè)角度看的確如此,但降價(jià)幅度如此之大、且降價(jià)的均是API調(diào)用費(fèi)而不是訂閱費(fèi)等特點(diǎn)來(lái)看,本次價(jià)格戰(zhàn)廠商們爭(zhēng)奪的目標(biāo)就是B端客戶(hù)和開(kāi)發(fā)者,一方面。通過(guò)降價(jià)甚至免費(fèi)的方式增加自家大模型調(diào)用量,是一種推銷(xiāo)、引流手段。
另外,更多客戶(hù)使用大模型各自場(chǎng)景里做數(shù)據(jù)、做微調(diào)來(lái)優(yōu)化模型,也能促進(jìn)更多AI應(yīng)用的誕生,進(jìn)而與大模型更深層次綁定。
另一方面,大模型能如此大幅度的降價(jià),其推理成本肯定通過(guò)某種方式實(shí)現(xiàn)了降低,推理成本的下降得益于模型優(yōu)化技術(shù)的快速迭代。
阿里云表示,通過(guò)構(gòu)建彈性的AI算力調(diào)度系統(tǒng)并結(jié)合百煉分布式推理加速引擎,阿里云優(yōu)化了大規(guī)模推理集群,大幅壓縮了模型推理成本并加快推理速度。
火山引擎總裁譚待在豆包大模型發(fā)布后表示,字節(jié)通過(guò)優(yōu)化模型結(jié)構(gòu)、將單機(jī)推理改為分布式推理、混合調(diào)度云計(jì)算算力等方式優(yōu)化了成本。
DeepSeek 相關(guān)負(fù)責(zé)人此前表示,DeepSeek-V2通過(guò)MoE模型架構(gòu)實(shí)現(xiàn)了模型結(jié)構(gòu)創(chuàng)新,成本降低的同時(shí),功能也更加強(qiáng)大。
本次價(jià)格戰(zhàn),真正把戰(zhàn)火擴(kuò)大的是云廠商。云廠商具備算力集中和規(guī)模效應(yīng)優(yōu)勢(shì),大模型落地是工程化實(shí)踐,工程化做得越好,大模型成本也就降得越低。
最后還有一點(diǎn)原因不得不提,宣布超低價(jià)、免費(fèi)的很多都是輕量級(jí)模型。比如百度宣布免費(fèi)的ERNIE Speed和ERNIE Lite,是兩款輕量級(jí)模型,支持8k和128k上下文長(zhǎng)度。
雖有誠(chéng)意不大的嫌疑,但大部分用戶(hù)的場(chǎng)景可能也不需要太大的參數(shù)。就像只玩掃雷,就沒(méi)必要給電腦配個(gè)4090顯卡。輕量級(jí)模型也許剛好能滿(mǎn)足使用場(chǎng)景,價(jià)格還更低,“效價(jià)比”拉滿(mǎn)。
不過(guò)從這里也能看出很多廠商既要流量,又要賺錢(qián)的心思。先用低價(jià)產(chǎn)品“請(qǐng)君入甕”,培養(yǎng)用戶(hù)粘性。后續(xù)就可以用各種方式刺激用戶(hù)使用高性能模型了,這些模型可并不便宜。就像網(wǎng)盤(pán)和下載工具,免費(fèi)體驗(yàn)付費(fèi)才有的高速下載,久而久之有的用戶(hù)自然就忍不了免費(fèi)但很慢的下載速度了。
嘗鮮大模型,或許有“坑”
這次的大模型的降價(jià)真正的誠(chéng)意有多少呢?會(huì)不會(huì)像一些游戲廣告,宣傳“注冊(cè)送手機(jī)”,結(jié)果想要領(lǐng)取需要達(dá)成海量前置條件呢?
拿豆包大模型來(lái)看,其通用模型pro-32k版推理輸入價(jià)格為0.8元/百萬(wàn)tokens,宣稱(chēng)比行業(yè)低99.3%。乍一看很便宜,但這是輸入價(jià)格,其輸出價(jià)格為2元/百萬(wàn)tokens,加權(quán)平均輸入輸出后,綜合收費(fèi)為1元/百萬(wàn)tokens。很多大模型和豆包一樣,降價(jià)公告著重宣傳輸入價(jià)格的低廉,而對(duì)輸出價(jià)格和綜合費(fèi)用等閉口不談。
豆包的價(jià)格規(guī)則最離譜的地方是其限制RPM為60,意思是只有每分鐘60個(gè)請(qǐng)求的話(huà),才是這個(gè)價(jià)格。可在真實(shí)的業(yè)務(wù)場(chǎng)景中,如果用戶(hù)想高頻次調(diào)用模型,那抱歉,沒(méi)有這個(gè)優(yōu)惠了。
另外,如前所述,很多參與降價(jià)的輕量級(jí)模型,等于是給了用戶(hù)一個(gè)“閹割版”大模型,無(wú)論從參數(shù)、生成速度,還是功能上肯定都是大打折扣的。當(dāng)期無(wú)法滿(mǎn)足用戶(hù)需求時(shí),用戶(hù)可能會(huì)選擇價(jià)格更昂貴的同廠商的高性能大模型。
雖說(shuō)這些都是正常的商業(yè)宣傳行為,但勢(shì)必會(huì)對(duì)很多沒(méi)加入價(jià)格戰(zhàn)的創(chuàng)業(yè)公司帶來(lái)巨大打擊。不同于云廠商大模型的背靠大樹(shù)好乘涼,很多創(chuàng)業(yè)公司承受不住如此大的降價(jià)。
所以本次價(jià)格戰(zhàn)并沒(méi)有卷入太多創(chuàng)業(yè)公司,也有人對(duì)價(jià)格戰(zhàn)的行為表示不理解?!拔矣X(jué)得大模型公司不會(huì)這么不理智,因?yàn)榧夹g(shù)是最重要的,如果技術(shù)不行,純粹靠貼錢(qián)方式去做生意,我們絕對(duì)不會(huì)跟這樣的定價(jià)做對(duì)標(biāo)。如果以后中國(guó)就這么卷,大家寧可賠光通輸都不讓你贏,那么我們就走海外市場(chǎng)?!绷阋蝗f(wàn)物創(chuàng)始人李開(kāi)復(fù)如是說(shuō)。
這次的價(jià)格戰(zhàn)本質(zhì)上還是在技術(shù)遇到瓶頸、產(chǎn)品同質(zhì)化嚴(yán)重的大環(huán)境下,大模型廠商寧愿燒錢(qián)也要打淘汰賽,今年注定會(huì)再次上演大模型行業(yè)新一輪淘汰賽。
正如云計(jì)算市場(chǎng)的競(jìng)爭(zhēng),大模型的價(jià)格戰(zhàn)一經(jīng)開(kāi)打就很難回頭,這種非良性的競(jìng)爭(zhēng)狀態(tài)或許會(huì)長(zhǎng)期持續(xù)。
硝煙散去,滿(mǎn)地狼藉,可能剩者為王,也可能全盤(pán)皆輸。