微軟“小冰”早已不再是那個單純的情感陪聊機器人,而是越發(fā)清晰地延展出一條“工業(yè)化”路線。從網(wǎng)紅到商業(yè)化,她的進階之路才剛剛開始。 記者 | 鄧舒夏 編輯 | 劉心力 試想一下,當你在一個軟件窗口的表格中輸入76個外貌形態(tài)信息、27個性格描述,以及幾項對事物的喜好,便可以通過3D模型生成一個符合上述特征的虛擬人物,它甚至可以被全息投影為一個不足50cm高的人像。 這樣的場景出現(xiàn)在“第七代微軟小冰”的發(fā)布會現(xiàn)場。2019年8月15日,微軟(亞洲)互聯(lián)網(wǎng)工程院在北京召開發(fā)布會,推出了一款名為“Avatar Framework”的工具包,它可以根據(jù)輸入的體態(tài)、性格和價值觀等信息,創(chuàng)造出特定人設的AI虛擬人物,而“小冰”就是基于這套定制框架下的產物。 5年前的5月29日,微軟(亞洲)互聯(lián)網(wǎng)工程院推出了一個名為“小冰”的智能聊天機器人。當時微軟的思路是:建立情感計算框架,采用代際升級的方式,研發(fā)一套兼具EQ和IQ的人工智能系統(tǒng)。 微軟小冰的人設是一名女性。 小冰走的是“情感”路線,這與當時人們津津樂道的人工智能方向并不相符。要知道,那時蘋果已經(jīng)推出基于手機的“Siri”語音助手,撥號、查天氣、定鬧鐘被公認是語音助手的必備技能;而后來出現(xiàn)的智能音箱語音助手,也都具備家居控制、點歌等任務技能;此外,還有一個人工智能的方向則是像AlphaGo那樣——下棋。 不過這在微軟(亞洲)互聯(lián)網(wǎng)工程院副院長、小冰團隊總負責人李笛看來,Siri科學家們的設計初衷與用戶需求是相背的——蘋果將Siri塑造成一個語音任務工具,但用戶只是想跟她聊天。“Siri 給了我們一個啟示,人工智能交互的基礎應該是閑聊。真正想去做一個無所不能的機器人,首先要做一個什么都能溝通的機器人,溝通是機器人的基礎服務。”李笛曾在一次采訪中表示。 李笛本人并非技術出身,卻一手操刀了小冰的“情感養(yǎng)成”,他稱小冰可以在與人聊天的過程中,借助電腦算法收集和分析人類的情感數(shù)據(jù),從而產生情感分析能力,然后反過來與人交流。 小冰的第一次亮相是作為微信上的一個“機器人網(wǎng)友”——16歲的處女座女孩,用戶添加她為好友后便可以跟她閑聊。這更像是一種“全民養(yǎng)成”的方式,比如在2014年9月17日小冰生日這一天,網(wǎng)友便在12個小時內為小冰填充了超過7萬條語料。 但具體如何用“0”和“1”教會小冰人類獨有的情感,李笛并沒有進一步說明。單從聊天這種形式來看,小冰似乎僅僅掌握了不同的語言風格,而非真正具備了情感。 第三代產品推出時,小冰具備了語音對話功能,隨后她不僅活躍在社交軟件中,與用戶玩成語接龍和猜謎,還進軍了文藝圈——至今小冰已經(jīng)參與到中國和日本50家電視臺的69檔欄目中。這進一步深化了小冰在公眾面前的“網(wǎng)紅”人設,但質疑聲也有不少,很多人認為她離網(wǎng)友很近,但離應用和商業(yè)化很遠,甚至還被貼上“無用AI”的標簽。 直到2017年,情況開始發(fā)生轉變。那年的5月,微軟公布了小冰的新技能——寫詩,并發(fā)布了一本小冰編寫的詩集《陽光失了玻璃窗》。這是小冰在學習519位現(xiàn)代詩人的作品后,通過深度神經(jīng)網(wǎng)絡技術模擬人類創(chuàng)作所得來的。在100小時、1萬次的訓練后,小冰逐漸形成了自己的創(chuàng)作風格。 然而,人工智能作詩卻為小冰團隊招來了許多非議。有人稱文學是人類獨有的感性結晶,并不能以機器訓練的方式獲得,小冰團隊的訓練“越界”了。不過這并沒有阻礙李笛等人的腳步,反而恰恰是小冰邁入文藝內容生產的開始。此后,小冰還與新聞機構合作,定期撰寫新聞稿件。 2018年7月,微軟發(fā)布小冰的第六代升級成果——唱歌。小冰可以利用人工智能歌聲合成技術,快速學習不同人類歌手的演唱風格,并在不同曲目中加以運用,從歌曲生成到調校只需不到5分鐘。例如,她可以模仿歌手騰格爾的風格演唱《隱形的翅膀》。但與初音未來等虛擬歌手不同,李笛并不想讓小冰成為網(wǎng)絡歌手中的“王菲”,也沒有透露其商業(yè)化的方向。 事實上,從2016年起,小冰團隊就開始嘗試商業(yè)化探索,而不僅僅讓其局限在“黑科技”里。但由于工程師們擔心交易方不能把一款具體的AI產品做好,便早早確立了不賣應用程序編程接口(API)的規(guī)矩。 李笛等人在今年似乎終于找到了方向,在2019屆中央美院的研究生畢業(yè)畫展中,有一位名叫夏語冰的同學,她以“中國的城市化進程”為題創(chuàng)作了多幅作品,該同學就是微軟小冰。 據(jù)李笛介紹,小冰首先海量學習了人類繪畫大師的作品,然后根據(jù)外部給定的“觸發(fā)詞”來作畫,其風格可以模仿某一位畫師,也可以基于自己的想法創(chuàng)作。李笛一再強調小冰的繪畫能力并不是建立在濾鏡和遷移的技術上,即從風景圖庫中搜索相應主題的畫面,然后用油畫濾鏡做處理。不過即便如此,小冰的創(chuàng)作也并不能100%比擬人類繪畫——小冰的畫更像是打印出來的壁紙,上面并沒有油畫顏料形成的斑駁筆觸。 微軟小冰在央美畢業(yè)畫展中的作品。 這次小冰團隊很快表達了對“商業(yè)化”的訴求。今年5月,微軟發(fā)布“小冰紡織服裝面料設計平臺”,陸續(xù)與SELECTED、萬事利等服裝紡織企業(yè)合作,為后者提供大量小冰生產的圖案設計方案。李笛表示:“這個行業(yè)的產業(yè)附加值低,人類設計師沒有辦法滿足這樣大體量和高頻率的設計?!?/div> 然而,微軟在AI商業(yè)化上的一個更大的野心是“Avatar Framework”,它就是小冰背后的技術框架。 “我們一直在思考人工智能的道路應該怎么走。是要做一個爆款的應用,還是做一個框架,讓人工智能無處不在?!蔽④洠▉喼蓿┗ヂ?lián)網(wǎng)工程院院長王永東在發(fā)布會上表示,顯然在這個問題上他已經(jīng)找到了答案。比如,今年7月軟銀發(fā)布的人形機器人Pepper使用的便是Avatar Framework中小冰的共感模型。 “我們認為未來3年至5年,無論做什么樣的人工智能產品,都繞不過今天小冰提出的Avatar Framework?!崩畹驯硎?。他將Avatar Framework形容為“高強度專利”,即一旦有公司將封閉域的產品做到開放域上,就無法繞過這個框架?!翱赡苡貌涣?年,未來3年里除非遇到競爭,否則Avatar Framework會出現(xiàn)在絕大部分成功的人工智能產品中?!彼^續(xù)補充道。 目前,Avatar Framework還沒有一個正式的中文名字,李笛曾戲稱它為“阿凡達”。不過他也坦言,這套框架仍處于“雛形”階段,僅僅擁有一些簡單的工具,還未達到可以批量應用的狀態(tài)。或許未來,小冰的作詩、唱歌、繪畫等能力也同樣可以被輸出。 在李笛看來,第一方品牌小冰并不是微軟商業(yè)化的重點。“人工智能產品設計領域本身還不夠成熟。我們只做平臺,別人也沒辦法使用,所以不得不去做一個小冰(去承載這個框架)。”李笛解釋道。如今小冰已經(jīng)在不同地區(qū)和領域分化出了不同名字,比如在日本它的名字叫りんな(凜菜)。在未來,李笛等人還計劃將其引入到車載場景中。 游戲、二次元和文學人物等角色被看做是小冰變身的首批目標。今年1月,微軟宣布在中國區(qū)開啟小冰的“賦生計劃”,將閱文集團下《全職高手》原著中的5個人物——葉修、黃少天、周澤楷、王杰希和喻文州,變成能夠與人實時交互的虛擬AI人物。 為了實現(xiàn)這點,Avatar Framework會首先閱讀分析《全職高手》文本,將小說中有關5人性格、語言習慣和三觀的信息提煉、分析并加以擬合,然后賦予他們符合人設的聲音,最終這5個AI人物變?yōu)榧t袖讀書App上的“24小時智能陪伴機器人”。目前Avatar Framework已經(jīng)創(chuàng)造出數(shù)十個虛擬人物,例如網(wǎng)易云音樂上的“多多西西”。小冰團隊甚至還為華為戰(zhàn)略市場部總裁徐文偉定制了一個智慧分身——Intelligent Digital William。 即便不自行生產硬件,小冰團隊也毫不避諱自己在硬件植入上的野心。過去一年,小冰以驚人的速度打入多個智能硬件市場。2018年8月,微軟發(fā)布Dual AI生態(tài),這是一項介于技術架構和產品之間的合作形式,它既可以幫助企業(yè)建立自己的AI平臺,又可以將自己的技能與現(xiàn)有的AI模型做融合。首批與微軟合作的企業(yè)有網(wǎng)易、華為、小米和騰訊等,如今這套系統(tǒng)已經(jīng)應用于4.5億臺第三方智能硬件設備。 “1年之前我們只開發(fā)了一些測試設備,從0到4.5億臺,我們只用了1年的時間?!崩畹颜f道。而微軟小冰團隊產品負責人彭爽表示,如今Dual AI已成為全球規(guī)模最大的跨領域人工智能系統(tǒng)之一,其與用戶的單次對話論數(shù)(CPS)能夠保持在23輪,合作陣營中又加入了OPPO和vivo兩家手機廠商。 當然,想要成為一個“人”,只有顏值和聽說能力是不夠的,還要具備視覺感官。目前,小冰已經(jīng)啟動了在日本的多模態(tài)感官公測,即通過一個放在上衣口袋中的攝像頭識別周圍環(huán)境,并根據(jù)所見事物實時與人溝通。同時,第七代小冰的核心對話引擎技術也得以升級,她能夠更準確地預測一段對話的走向,從而主動發(fā)問并主導對話,然而,并不是所有硬件都能實現(xiàn)圖像加全雙工語音處理。由于人工智能牽扯到非常巨大的數(shù)據(jù)計算量,即便在算法和能力上獲得新的突破,但由于便攜硬件設備的運算能力有限,也不容易得以應用?!笆謾C上很難跑,像耳機、頭盔上就更難跑了?!毙”鶊F隊技術負責人周力表示。不過他斷言,5G帶來的高速傳輸和低延時,可以讓人工智能應用在移動設備上大展拳腳。 如今,小冰早已不再是那個單純的情感陪聊機器人,而是越發(fā)清晰地延展出一條“工業(yè)化”路線。目前,可以梳理出的小冰量產生產線有故事文本、旋律描述、紡織服裝、可交互有聲繪本等。Avatar Framework也已面向全部合作伙伴和客戶開放,針對個人用戶的版本也將于明年春季發(fā)布。 在發(fā)布會上,李笛并沒有透露小冰項目的營收數(shù)字,但他表示:“國內人工智能領域的大企業(yè)我們都曾接觸過,一般來講我們的報價都是它們的3倍以上,但因為我們的產品方案完全不同,所以成功率非常高?!?/div> 從網(wǎng)紅到商業(yè)化,小冰的進階才剛剛開始。
|
|
來自: 掃地僧一一 > 《1532、定制一個“虛擬人”》