2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色

分享

硬件戰(zhàn)火重燃,誰能定義AI耳機?

 天承辦公室 2025-02-02

圖片

AI硬件江湖風云再起,AI耳機只是前菜。”                                          
作者丨吳憂
編輯丨劉偉
圖片
圖片
AGI時代,擁有大模型基座的字節(jié)重新做硬件,故事的走向會有何不同?

01

Ola Friend,豆包的硬件入口

2024年10月初,字節(jié)發(fā)布的豆包AI耳機Ola Friend曾掀起一陣熱議。

Ola Friend售價1199元,無需打開手機就能通過語音喚起豆包進行對話,無論是信息查詢和旅游出行,還是口語練習和情感交流,都能給出及時的反饋,很像一位賽博好友。
4個月過去了,Ola Friend在京東、淘寶平臺上的銷量分別為1w+和6K+,累計銷量不到Airpods季度銷量的千分之一。目前字節(jié)AI耳機的話題熱度顯然被AI百鏡大戰(zhàn)蓋過,比起耳機,大家似乎更關注AI眼鏡。

圖片

Ola Friend
確實與AI眼鏡相比,AI耳機是更加小眾的AI硬件,小眾到不足以各大電商平臺為其單獨設置品類,業(yè)界對AI耳機也沒有十分明確的定義。
聲智科技產(chǎn)品副總裁黃赟賀在雷峰網(wǎng)連線直播時解釋了AI耳機與傳統(tǒng)TWS、OWS耳機的不同之處,這可能是感知AI耳機比較直觀的方式。
“AI耳機進一步提升了用戶體驗的智能化及豐富性。從技術層面看,AI耳機需要人工智能與聲學算法的交叉技術作為底座,即要能夠提供復雜場景內(nèi)高質量的聲音傳輸,還要具備低延時的語音交互的能力,實現(xiàn)從圖形界面交互到語音交互的人機交互形態(tài)升級。從功能體驗看,搭載AI智能體的AI耳機服務場景更多元,包含教育、工作、娛樂、生活等領域的'管家式’服務,提供更便捷的信息獲取方式。對于追求科技感和體驗升級的消費者而言,AI耳機無疑提供了更前沿的選擇。
Ola Friend除了在功能上更偏向生活助理的角色,其他方面符合黃赟賀對AI耳機的定義。
但在IKKO聯(lián)合創(chuàng)始人Echo Chan看來,真正的AI硬件應該有獨立的載體和算力,即可以脫離手機APP獨立運行,而Ola Friend本質上是通過手機APP完成所有功能,嚴格來講不屬于AI耳機。
作為獨立智能體的擁護派,往往會給耳機倉配備智能屏且開發(fā)了一套自有操作系統(tǒng),即不連接手機APP耳機也能正常運行。既存在旨在幫助用戶提高學習以及生產(chǎn)效率,實現(xiàn)會議錄音和轉寫等AI輔助功能的產(chǎn)品,例如IKKO;也存在想要實現(xiàn)AI生活助理的愿景,包括存儲用戶即時輸入的語音信息并發(fā)出提醒,幫助用戶構建外部大腦,與豆包耳機的功能更加接近的生活助理類AI的產(chǎn)品,例如WISHEE。
信奉“最先愿意為新技術服務的人群一定愿意為生產(chǎn)力工具付費”的Echo Chan不認同AI耳機作為生活助理暫時能夠為用戶提供多大幫助,但他肯定字節(jié)發(fā)布AI耳機的價值:
“字節(jié)推出的這款產(chǎn)品擴大了大家對AI耳機的認知,且將價格定位在千元以上,已經(jīng)產(chǎn)生品牌溢價,這對行業(yè)來說是積極的信號”,Echo Chan說到。
在接受雷峰網(wǎng)采訪的幾周前,IKKO剛剛結束一場與小紅書的直播合作,在直播15分鐘完成100萬gmv目標。談及比豆包耳機更高的定價,Echo Chan表示前期打好用戶基礎非常重要,高價能夠為產(chǎn)品打下很好的用戶基礎,與用戶之間的互動能推動更加高效的產(chǎn)品迭代。
Echo Chan向雷峰網(wǎng)透露,2024年IKKO的出貨量大概達到6000萬營業(yè)額,主要銷往美國和歐洲,目前每個月的復合增長率達到30%以上,按照目前的增長趨勢不下滑且產(chǎn)能充足的情況下,2025年的營業(yè)額能夠達到1億至2億。庫存不足是IKKO目前所面臨的最大難題,生產(chǎn)效率有待進一步提升。
IKKO可以是獨立設備,豆包耳機離不開豆包APP,“只是作為鏈接豆包大模型的入口”也是Ola Friend被業(yè)界詬病最多的地方,認為這只是一次TWS耳機與語言大模型的粗糙結合,字節(jié)拿著錘子找釘子,在為豆包大模型找應用場景,Ola Friend沒有很強的不可替代性。
雷峰網(wǎng)了解到,字節(jié)曾與不止兩家耳機公司洽談合作事宜,條件是只接入豆包一家語言大模型,不少潛在合作對象認為豆包大模型和ChatGPT還有一定差距,且不愿意與豆包大模型深度綁定,因此拒絕了與字節(jié)的合作。
但Oladance創(chuàng)始人李浩乾把耳機這一可穿戴設備當做入口的思路卻意外與字節(jié)契合。李浩乾曾在2021年接受雷峰網(wǎng)采訪時提出,元宇宙主要有兩個入口場景,在家和辦公室依托于重設備,在外通勤依托輕設備,耳機瞄準的是通勤場景,Oladance希望在TWS上做突破,建立鏈接元宇宙的入口。
當時ChatGPT3.5尚未發(fā)布,元宇宙和Web3.0還是當紅概念,TWS耳機的競爭已十分激烈,除了骨傳導和助聽器,業(yè)界對TWS耳機想象乏力。李浩乾的觀點卻讓業(yè)界耳目一新,在新消費資本市場最低迷的時候,李浩乾的電話被投資人打爆。
沒能等到元宇宙,先等來了字節(jié)的豆包大模型。2024年4月,字節(jié)跳動以3-5億元的價格收購Oladance,6個月的時間,Oladance作為人機語音交互的入口,完成了向AI耳機的華麗轉身。

02

是AI重要還是耳機重要?

追問字節(jié)能否做好一款AI耳機,本質上是在追問AI硬件到底是AI本身的能力更重要還是硬件能力更重要。

許多AI耳機賽道的玩家在同雷峰網(wǎng)的交流中表達了同樣的觀點:不認為自己是一家耳機公司,只是在開發(fā)AI硬件道路上恰好選中耳機這一形態(tài)。
在第一波AI浪潮中創(chuàng)辦時空壺的田力對此具有發(fā)言權,其W系列翻譯耳機保留了TWS耳機的產(chǎn)品形態(tài),但卻舍棄了最核心的聽音樂功能,更早期的產(chǎn)品甚至不能接電話。
當時田力剛剛離開一家機器人硬件公司,想用AI技術本身做點有價值的事情。田力認為,彼時AI技術雖然很發(fā)達,但還缺少與普通人的需求鏈接。恰逢父母海外旅游時遇到交流障礙,在田力看來,盡管語音識別與機器翻譯的技術已經(jīng)較為成熟,但人們出國時依舊沒有意識到可以利用該技術隨時自由溝通,這表明AI技術與現(xiàn)實需求仍存在距離。
在感知到AI領域的市場機遇及行業(yè)中潛存的問題后,2016年田力迅速組建團隊,試圖以“AI+翻譯”構建跨語言溝通的多樣場景。身為科幻迷的田力從《銀河系漫游指南》中巴別魚的設想中獲得靈感,他認為在跨語言交流中,翻譯不是要解決的核心問題,而是交流的沉浸感。
從技術實現(xiàn)的角度,翻譯耳機要求對話中的雙方都擁有相同的耳機設備,只有在共享一副支持雙通道耳機的情況下才能實現(xiàn)這一場景。早期的TWS耳機采用單通道互聯(lián)技術,手機發(fā)射藍牙信號時主耳先收到信號,再將信號發(fā)送給副耳,會出現(xiàn)信號不同步的情況。另外,如果增加聽音樂的功能就要犧牲翻譯所需要的算力,與田力所期望的沉浸感相悖。
他認為既然時空壺要解決的核心問題是跨語言交流,就不應該給消費者“購買一副附帶翻譯功能耳機”的預期,田力團隊重新撰寫部分藍牙協(xié)議,摒棄音樂播放功能,一副形似耳機實則是AI翻譯設備由此而來。
另一AI耳機品牌WISHEE聯(lián)合創(chuàng)始人兼董事長張博在與雷峰網(wǎng)的交流過程中也多次提及WISHEE想要做的是獨立的AI智能體而不是TWS耳機。
這源于張博和團隊其他同事此前的工作經(jīng)歷。張博在參與WISHEE創(chuàng)辦之前是OPPO語言助手項目中的一員,見證過OPPO語音助手從0到1的搭建。在參與手機語音助手的項目過程中,張博發(fā)現(xiàn),手機語音助手的本質是在和用戶的對話框模式使用習慣打架,打贏的概率微乎其微。
2011年,喬布斯推出Siri不久后離世,給蘋果留下了Siri到底是做搜索引擎還是做智能助手的世紀難題,后來Siri團隊核心成員離開,Siri的發(fā)展更是撲朔迷離。張博堅信喬布斯對Siri有更宏大的設想,重建可以直接進行語音交互調(diào)用的獨立系統(tǒng)或許是未來方向之一。
建立在這一構想之上,WISHEE推出了一款AI智能體產(chǎn)品AiEar并于2024年618正式售賣,售價1999元。從用戶體驗來看,AiEar比傳統(tǒng)TWS多了一款植入耳機艙表面的智能屏幕,擁有獨立的OS系統(tǒng),可以插入esim卡實現(xiàn)語音通話,也可以作為移動wifi供其他移動設備連網(wǎng)使用。

圖片

電影《Her》中的AI智能體設備
WISHEE的市場負責人向雷峰網(wǎng)展示了AiEar的其他功能,包括敲木魚小游戲、電子寵物、番茄時鐘、GPS導航、語音記憶等功能,談及對AiEar未來的想象,這位負責人情緒飽滿,表示還有更多的功能正在開發(fā)中。在加入WISHEE團隊之前,WISHEE的市場負責人是一家公關公司的老板,服務過眾多手機、耳機品牌,如今他幾乎關掉了自己公關公司的業(yè)務,全盤押注WISHEE。
據(jù)他透露,目前有一些考研黨在使用AiEar,還有一部分不希望小朋友玩游戲的家長會買來送給孩子,WISHEE目前主要面向國內(nèi)市場,正在與海外眾籌平臺洽談計劃出海。
基于過往在AI聲學領域的經(jīng)驗積累,科大訊飛旗下的未來智能是少有承認自己在做AI耳機的公司,且在產(chǎn)品研發(fā)的過程中愈發(fā)感受到硬件能力的重要性。
未來智能CPO柳達本身也是一名耳機重度使用者。未來智能還沒成立之前,柳達在科大訊飛消費者BG做云助手項目,每天的工作被大量的會議與信息充斥,耳機成為柳達最親密的工作伙伴。在使用TWS耳機的過程中,柳達愈發(fā)覺得傳統(tǒng)TWS耳機只滿足了消費者最基本的需求,對于信息輸入大于輸出的用戶來講,完全沒有發(fā)揮其作為工具的潛力,完全可以基于TWS耳機針對會議錄音和紀要等功能進一步改善。
柳達向雷峰網(wǎng)表示,早期組建團隊時低估了硬件的重要性,團隊軟件成員數(shù)量遠大于硬件人員,直到第一代產(chǎn)品發(fā)布,收到來自消費者的反饋認為與同等價位的TWS耳機相比,訊飛AI會議耳機作為硬件產(chǎn)品不達預期,后來及時調(diào)整提高硬件人員的占比,耳機品質才得以改善。
一副兼具TWS基本能力的AI耳機在硬件層面需要解決來自續(xù)航能力、聲學設計、硬件堆疊與散熱等方面的技術難題。TWS耳機要求體積小,能夠容納的電池體積有限,對續(xù)航能力構成挑戰(zhàn),尤其是主動降噪式耳機需要多顆麥克風,如果要實現(xiàn)本地存儲功能還需要額外增加閃存芯片,進一步壓縮電池空間。AI功能的增加和運行會消耗更多電量并產(chǎn)生熱量,例如語音識別、語義理解、語音增強等功能的實現(xiàn)都需要持續(xù)供電。
少數(shù)高端TWS耳機有能力采用SiP封裝節(jié)省空間,但這一封裝方式技術難度大且價格昂貴,也會增加產(chǎn)品成本。
可以想象成是把聰明的大腦裝進小盒子里,需要非常流暢、精準和省電”,柳達如此形容。
通過不斷增強硬件隊伍和幾代耳機的研發(fā)升級,未來智能推出的訊飛AI會議耳機iFLYBUDS PRO2在續(xù)航方面已經(jīng)做到單次使用長達9小時,搭配充電盒可延長至36小時。在去年雙十一上,訊飛AI會議耳機的銷售額在天貓、抖音兩大平臺的入耳式藍牙耳機大類目中銷售額排名第一,在京東AI耳機品類占據(jù)榜首。
回到豆包AI耳機本身,字節(jié)坐擁AI基礎設施,至少與需要調(diào)用非自家大模型API的創(chuàng)業(yè)公司相比,豆包AI耳機將最核心的數(shù)據(jù)資產(chǎn)始終握在自己手中,但另一方面與某一模型深度綁定也意味著前期需要經(jīng)歷漫長的磨合期和迭代期,與可以同時接入多家大模型的中小廠商相比,前期語音交互的準確率不占優(yōu)勢。
與此同時,大廠做AI硬件也有決策慢、流程長的問題。一位業(yè)內(nèi)人士告訴雷峰網(wǎng),目前還沒有聽聞大廠All in AI硬件的消息,基本都是中小廠All in,大廠內(nèi)部審批及決策流程非常漫長,需要結合公司主營業(yè)務拓展賽道,預計25年下半年才會有大廠正式入局AI硬件,留給中小廠的窗口期還有半年至一年。有關大廠AI硬件的最新動態(tài),歡迎添加本文作者微信Yolanda_Zuu爆料。
Echo Chan也表示,預計25年下半年IKKO才會遇到真正的競爭對手,且更有可能來自手機大廠而非互聯(lián)網(wǎng)大廠,因為手機廠商在硬件供應鏈方面比互聯(lián)網(wǎng)大廠更強勢。
FoloToy創(chuàng)始人王樂認為只有高集成度才能提升系統(tǒng)級的體驗,手機廠商這方面占據(jù)優(yōu)勢。
以字節(jié)為首的互聯(lián)網(wǎng)大廠做AI硬件具備人才與資金優(yōu)勢。關注AI硬件創(chuàng)業(yè)的真格基金投資經(jīng)理李鈺看好互聯(lián)網(wǎng)大廠的軟件產(chǎn)品經(jīng)理創(chuàng)業(yè)做AI硬件,如果再找到懂供應鏈和硬件生產(chǎn)的專家一起組建團隊,會是一個好標的?!耙驗橛布臉I(yè)者只擅長做標準化,售后受限,不適合主導這件事,而軟件是需要持續(xù)迭代?!?/span>
王樂也表示,深圳做硬件和方案的公司轉型做AI的難點在于之前做方案的毛利很低,利潤不足以支撐公司招軟件和AI方面的人才,成本挑戰(zhàn)大。

03

下一代爆款移動設備誕生前夜

AI耳機只是過渡產(chǎn)品?

“AI是技術基座,耳機本身是交互載體,各占一半,但最終服務的是人,用戶體驗才是最重要的”,田力認為找到能夠為用戶提供服務的切入點比討論AI重要還是耳機重要更有意義。

無論是否承認自己是一家AI耳機公司,還是將自己單純定義為AI硬件公司,這些選擇將AI與耳機產(chǎn)品形態(tài)結合的公司無一例外都認同從供應鏈成熟度以及AI語音交互形式來看,現(xiàn)階段耳機是比眼鏡更能承載AI能力的硬件載體。
目前市面上的AI硬件產(chǎn)品大致可以分為兩大類,一類是在傳統(tǒng)智能硬件的基礎上做生成式AI的加持,例如在眼鏡、耳機上增加AI功能,不改變原有的產(chǎn)品形態(tài);另一類是AI重塑產(chǎn)品形態(tài),創(chuàng)造新的用戶需求和應用場景,例如一年前爆火的AI Pin和Rabbit。
第一類的支持者認為從人類技術發(fā)展史來看,產(chǎn)品形態(tài)基本沒有太多變化,手表、手機、耳機等幾十年前就已經(jīng)存在,這證明用戶很難被教育,AI硬件需要在原本不夠智能化的地方發(fā)力,而不是創(chuàng)造全新且無用的東西再思考如何智能化。
第二類的支持者一部分認為AI的能力強大到需要全新的產(chǎn)品形態(tài)來承載,另一部分集中在研發(fā)為人類提供陪伴和情緒價值的AI玩具,因娛樂性和高容錯性也已經(jīng)有一定的市場。歡迎添加本文作者Yolanda_Zuu交流討論中國AI硬件江湖。
AI耳機更像是介于第一類和第二類之間的產(chǎn)品。耳機本身發(fā)展已久,TWS耳機掀起的浪潮已經(jīng)培養(yǎng)起用戶對耳機的依賴和長期佩戴的可能性。根據(jù)Canalys的最新研究,TWS在2024年第二季度仍然是全球智能個人音頻市場的領導者,以12.6%的年增長率鞏固了72.6%的市場份額。
TWS耳機的爆火已經(jīng)證明了耳機本身不與手機直接競爭,甚至填充了無法使用手機的時間,在交互形式上具備優(yōu)勢。建立在大家對耳機高接受度的基礎之上,一方面可以基于生成式大模型在AI語音助手再升級,另一方面耳機艙也有很多可探索的空間。
進入低價競爭時代的TWS耳機也已經(jīng)建立起成熟的產(chǎn)業(yè)供應鏈,即便是AI耳機需要根據(jù)新增的功能植入存儲器、射頻等器件,與TWS耳機供應鏈有所不同,但也能被成熟的手機供應鏈所覆蓋。
從交互習慣的角度來看,也有觀點認為AI耳機沒有想象中那么容易被用戶接受。
RWKV聯(lián)合創(chuàng)始人羅璇表示:與手指操作相比,純語音交互是一件更加困難、更加耗能且泄漏隱私的事情。而且在人類歷史上,手指操作工具比語言更早出現(xiàn)。因此更看好AI眼鏡,手指+語音的模式。
柳達在十年前就思考過,何時我們使用語音交互的頻率能夠同對話框交互一樣高:一是需要在技術和體驗層面有重大突破,不僅是技術改進還包括用戶習慣的改變;二是語音識別需要更加精準,對話的自然度和流暢度進一步提高,語義理解能力進一步增強;三是多模態(tài)融合會是未來大趨勢,語言交互和指尖交互無縫切換。
這也是AI耳機玩家們曾經(jīng)思考過或正在思考的問題。李浩乾曾在2021年與雷峰網(wǎng)對話時表示,Oladance在做TWS耳機之前就是嘗試過做眼鏡,但發(fā)現(xiàn)市場不成熟最后選擇放棄。WISHEE曾經(jīng)也嘗試探索AI眼鏡,發(fā)現(xiàn)AI眼鏡不僅需要考慮如何存儲視頻數(shù)據(jù),還需要高維度提取特征,而AI耳機在技術上已經(jīng)準備好。IKKO也表示,在做AI耳機的同時也有對AI眼鏡的積極探索。
或許從多模態(tài)融合的趨勢來看,有視覺交互可能性的AI眼鏡確實會是AI耳機的終極形態(tài),但從AI耳機到AI眼鏡還有很長的一段路要走。AI硬件大戰(zhàn),好戲才剛剛開始圖片

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多