2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色

分享

Yoshua Bengio獨(dú)家專訪:我不想把大模型未來押注在Scaling Law上,AGI路上要“注意安全”

 liuaqbb 2024-04-18 發(fā)布于北京
圖片
來源: 智源社區(qū)

導(dǎo)讀

漫長的30年間,數(shù)度從主流方向的超然出走,是Bengio的制勝秘訣。這種不盲從主流的風(fēng)格體現(xiàn)在他研究生涯的方方面面。

90年代末期,神經(jīng)網(wǎng)絡(luò)被打入冷宮,Bengio的論文多次遭拒,連學(xué)生們也開始擔(dān)心,和他一起研究神經(jīng)網(wǎng)絡(luò)會(huì)導(dǎo)致畢業(yè)后找不到工作。

“那場(chǎng)有關(guān)神經(jīng)網(wǎng)絡(luò)的文化沙漠可能'勸退’了很多研究者,但我有點(diǎn)固執(zhí),堅(jiān)信我們應(yīng)該堅(jiān)持下去。”而時(shí)過境遷,如今神經(jīng)網(wǎng)絡(luò)早已成為主流,審稿人的看法也發(fā)生了翻天覆地的變化。

此時(shí),Bengio卻已經(jīng)開始研究新方向,尋找新問題?!拔艺J(rèn)為不能把所有雞蛋放在一個(gè)籃子里,我們應(yīng)該探索更多不同的方法。在過去的七年里,我一直在努力探索當(dāng)前神經(jīng)網(wǎng)絡(luò)方法的局限性,這樣才能讓未來的人工智能具備當(dāng)前缺乏的能力?!?/span>

談及現(xiàn)如今Scaling Law催生的模型性能大爆發(fā),Bengio依然保持著客觀審慎的思考,他認(rèn)為“Scaling Law并不是理論定律,只是基于經(jīng)驗(yàn)性觀察總結(jié)的規(guī)律。為了解決大模型目前存在的問題,我們需要探索Scaling Law之外的新方法?!?/span>

在OpenAI等巨頭紛紛為AGI的到來摩拳擦掌之時(shí),Bengio更關(guān)心的是如何應(yīng)對(duì)AI對(duì)人類的潛在風(fēng)險(xiǎn)。正如奧本海默所帶來的核末日一樣,AI引發(fā)的人類安全危機(jī)甚至比核武器更為沉重。Bengio坦言,假如有機(jī)會(huì)回到年輕時(shí),會(huì)提醒當(dāng)時(shí)的自己注意AI風(fēng)險(xiǎn),而即便覆水難收,當(dāng)下最重要的是明確,“我能做什么,我們每個(gè)人能為一個(gè)更好的世界做什么?!?/span>

以下為專訪全文(為方便流暢閱讀,筆者進(jìn)行了不改變?cè)獾木庉嫞?/span>

要點(diǎn)速覽


  • 我們家里沒有很嚴(yán)格的家規(guī),無論是上學(xué)還是寫作業(yè),父母總是會(huì)關(guān)心我和弟弟想做什么。父母賦予了我自由和批判性思維,這對(duì)于科學(xué)家來講非常重要,因?yàn)榭茖W(xué)研究必須跳出思維的條條框框。
  • 2000年代,學(xué)術(shù)界對(duì)神經(jīng)網(wǎng)絡(luò)已經(jīng)不抱希望了。學(xué)生們也會(huì)擔(dān)心,和我一起研究神經(jīng)網(wǎng)絡(luò)會(huì)導(dǎo)致他們“畢業(yè)即失業(yè)”。我有一種直覺,神經(jīng)網(wǎng)絡(luò)可以克服維數(shù)災(zāi)難。
  • 我不想把人類的未來押注在對(duì)“Scaling Law”的盲從,擴(kuò)大模型規(guī)模不是提升模型性能的唯一制勝法寶,為了解決大模型目前存在的問題,我們需要探索新的方法。
  • 去做“第一個(gè)吃螃蟹的人”固然很難,因?yàn)闆]有即時(shí)的研究成果激勵(lì)人堅(jiān)持下去。因此需要建立探索新想法、新路徑的社會(huì)機(jī)構(gòu),支持研究者在感興趣的研究方向上花費(fèi)大量時(shí)間,即使可能根本行不通。
  • 經(jīng)驗(yàn)豐富的人通常能發(fā)揮重要作用,但他們也可能因?yàn)楣虉?zhí)己見而作出錯(cuò)誤判斷。作為科學(xué)家,你可以根據(jù)自己的經(jīng)驗(yàn)、知識(shí)來采納這些意見,通過實(shí)驗(yàn)研究來驗(yàn)證,也可以不予理睬,等待時(shí)間去證明事情的真相。
  • 研究者要保持謙虛。你必須接受自己可能會(huì)犯錯(cuò)。在我的職業(yè)生涯中,想法改變了很多次,但這沒關(guān)系。事實(shí)上,正是勇于承認(rèn)錯(cuò)誤才展現(xiàn)出你的聰明和謙遜,并且表明你充分認(rèn)識(shí)到自身知識(shí)的局限性。
  • 堅(jiān)持閱讀很重要。我認(rèn)為更重要的是閱讀的時(shí)間,而不是數(shù)量。(如果非要說時(shí)間的話)大概三小時(shí)左右。
  • 我和Hinton、LeCun專注于不同的研究方向,但我們互相分享想法、觀點(diǎn)、論據(jù)和結(jié)果,借鑒彼此的想法和思維方式,彼此都能從中獲益,并且能以彼此的工作成果為基礎(chǔ),不斷實(shí)現(xiàn)新的突破。我們從來不會(huì)評(píng)判誰是對(duì)的、誰是錯(cuò)的,也不會(huì)將自己的想法強(qiáng)加于其他人。
  • AI帶來的災(zāi)難性后果可能比核武器更嚴(yán)重。少數(shù)核彈爆炸會(huì)造成數(shù)百萬人死亡,但人類仍將繼續(xù)存在。但如果我們??創(chuàng)造了一個(gè)超越人類智能的AI,它可能會(huì)發(fā)明一種生物武器來殺死全人類。在這場(chǎng)AI帶來的災(zāi)難中,將無人幸免。
  • 如果全人類能夠統(tǒng)一成一個(gè)人、一種思想,AI安全的問題就迎刃而解了。問題在于,這世界上的每個(gè)人都有不同的思想,有些人會(huì)嘗試一些瘋狂的事情,可能需要全人類來承擔(dān)。

智源專訪欄目意在通過展現(xiàn)技術(shù)研究者和創(chuàng)業(yè)者的研究經(jīng)歷和故事,記錄技術(shù)世界的嬗變,激發(fā)當(dāng)代AI從業(yè)者的創(chuàng)新思維,啟迪認(rèn)知、關(guān)注突破性進(jìn)展,為行業(yè)注入靈感光芒。本次專訪為總第15期(下集在文章結(jié)尾)

本期邀請(qǐng)到世界級(jí)人工智能專家、圖靈獎(jiǎng)得主Yoshua Bengio,Bengio現(xiàn)任蒙特利爾學(xué)習(xí)算法研究所(Mila)創(chuàng)始人和科學(xué)主任、蒙特利爾大學(xué)教授。他不盲從主流的研究風(fēng)格來源于父母早年側(cè)重于自由探索和批判思維的家庭教育,近年來Bengio把研究重心轉(zhuǎn)向了AI for science、系統(tǒng)2和AI安全。

采訪:李夢(mèng)佳
撰文:李夢(mèng)佳,楊周錦

AI啟蒙之路:阿西莫夫科幻小說、可編程計(jì)算器、神經(jīng)網(wǎng)絡(luò)的新大陸

您第一次接觸到計(jì)算機(jī)科學(xué)是什么時(shí)候?如何發(fā)現(xiàn)自己的興趣并走上這條道路的?

我開始接觸到這個(gè)領(lǐng)域時(shí)只有十幾歲。在那個(gè)年代,可編程計(jì)算器非常流行,也吸引著我。后來,我逐漸對(duì)計(jì)算機(jī)產(chǎn)生了興趣,學(xué)會(huì)了針對(duì)計(jì)算器上的匯編語言。

后來,我和弟弟(編者注:同哥哥一樣,Samy Bengio也在深度學(xué)習(xí)方面頗有建樹,他是谷歌杰出科學(xué)家,也是Google Brain首批員工之一。)一起攢錢買了我們的第一臺(tái)電腦。當(dāng)時(shí)還沒有成熟的個(gè)人電腦軟件產(chǎn)業(yè),所以我們學(xué)習(xí)了一些簡單的編程語言,自行編寫軟件程序讓電腦執(zhí)行,這些經(jīng)歷對(duì)我們來說非常寶貴。沒有老師教我們,所以我們只能通過閱讀和實(shí)踐自學(xué)成才。

這些早期經(jīng)歷讓我對(duì)計(jì)算機(jī)科學(xué)產(chǎn)生了濃厚的興趣,最終在上大學(xué)時(shí)選擇它作為我的專業(yè)。同時(shí),我也對(duì)物理學(xué)和數(shù)學(xué)感興趣,所以在研究生期間我也選修了一些偏理論性的研究方向。

您是如何進(jìn)入神經(jīng)網(wǎng)絡(luò)這個(gè)領(lǐng)域的?

研究生入學(xué)之初,我讀了幾篇關(guān)于神經(jīng)網(wǎng)絡(luò)的論文。我覺得這個(gè)研究領(lǐng)域非常有趣,就像發(fā)現(xiàn)了一片新大陸一樣興奮,我想閱讀更多神經(jīng)網(wǎng)絡(luò)相關(guān)的論文。

我讀了幾篇Hopfield和Hinton在1982年發(fā)表的論文,接著是1985年關(guān)于反向傳播(back propagation)的論文。1986年,我讀了Hinton和其他幾位作者共同撰寫的名為《并行分布式處理》(Parallel Distributed Processing)的一本書。那是神經(jīng)網(wǎng)絡(luò)研究的早期階段,這些學(xué)者稱自己為連接主義者(connectionist)。這些論文深刻地影響了我的研究視野、對(duì)神經(jīng)網(wǎng)絡(luò)的理解以及研究方向。

有沒有某一事件或某個(gè)時(shí)刻,給了你計(jì)算機(jī)將改變世界的靈感?

十幾歲的時(shí)候,我讀了大量科幻小說,比如阿西莫夫的作品。早在上世紀(jì)40年代,人們已經(jīng)開始思考變得更聰明的人工智能和計(jì)算機(jī)將會(huì)怎樣。包括阿蘭·圖靈在內(nèi)的許多計(jì)算機(jī)科學(xué)先驅(qū)都預(yù)見了,總有一天我們會(huì)制造出足夠聰明的機(jī)器。這到底是創(chuàng)造偉大還是暗藏危機(jī)?早在70年前計(jì)算機(jī)科學(xué)家們已經(jīng)在思考這些問題了。

圖片

發(fā)表于1942年的短篇小說《環(huán)舞》(Runaround)中,阿西莫夫第一次提出“機(jī)器人三定律”,以避免人類被自己創(chuàng)造出的機(jī)器傷害,該作品對(duì)機(jī)器人和人工智能領(lǐng)域的科學(xué)家產(chǎn)生了深遠(yuǎn)影響。
父母的人生課:
自由探索、批判思維和多樣生活

你的父母來自巴黎,一家人從法國搬到了加拿大。童年經(jīng)歷是如何影響你后來的生活經(jīng)歷和工作風(fēng)格的?

我們家沒有很嚴(yán)格的家規(guī),無論是上學(xué)還是寫作業(yè),父母總是會(huì)關(guān)心我和弟弟想做什么。我父親常說,父母應(yīng)該從孩子身上學(xué)習(xí),而不是孩子對(duì)父母耳提面命。

我的父母賦予了我很多自由和批判性思維。這對(duì)于科學(xué)家來講至關(guān)重要,科學(xué)家必須跳出思維的條條框框。你必須相信自己解決問題的能力、承擔(dān)風(fēng)險(xiǎn)、表達(dá)出你不確定的想法。這種自由的氛圍對(duì)我非常有幫助。在不同國家之間搬遷實(shí)際上也是了解觀點(diǎn)多樣性、文化和語言多樣性的良好經(jīng)歷。

在科學(xué)領(lǐng)域我們需要格外謹(jǐn)慎,因?yàn)槲覀儾荒艽_保自己掌握的就是真理。我們必須允許自己犯錯(cuò)誤,考慮與自己相悖的觀點(diǎn),因?yàn)槲覀兒芸赡苁清e(cuò)的。因此,文化多樣性對(duì)于研究者來說是一堂很好的人生課。

大模型前身,注意力機(jī)制,圖靈獎(jiǎng)

您在過去幾十年取得了許多重要的成就,您認(rèn)為其中最重要、最有價(jià)值的工作有哪些?

在NeurIPS 2000上,我發(fā)表了一篇關(guān)于使用神經(jīng)網(wǎng)絡(luò)構(gòu)建語言模型的論文,這是大語言模型的前身,只不過規(guī)模更小,使用的語料庫也更小,沒有用到Transformer中的注意力機(jī)制。

2006年前后,深度學(xué)習(xí)復(fù)興浪潮逐漸興起。在NeurIPS 2007上,我發(fā)表了深度學(xué)習(xí)領(lǐng)域的經(jīng)典論文《Greedy Layer-Wise Training of Deep Networks》并做現(xiàn)場(chǎng)學(xué)術(shù)報(bào)告。

在這篇論文中,我們首次找到了訓(xùn)練深層網(wǎng)絡(luò)的方法,展示了如何使用多層神經(jīng)網(wǎng)絡(luò)獲得更好的泛化效果。我們之前認(rèn)為深層網(wǎng)絡(luò)可能有用,但不知道如何訓(xùn)練,傳統(tǒng)的訓(xùn)練方法并不奏效。

2014年,我們團(tuán)隊(duì)受到人類認(rèn)知機(jī)制的啟發(fā),在論文《Neural Machine Translation by Jointly Learning to Align and Translate》中首次將注意力機(jī)制應(yīng)用于自然語言處理領(lǐng)域,大大提升了機(jī)器翻譯的性能。這篇發(fā)表在 ICLR 2015 上的論文引起了行業(yè)熱議,啟發(fā)了后續(xù)的一系列語言大模型研究。

就在論文發(fā)表的一年后,谷歌在2016年將這項(xiàng)技術(shù)應(yīng)用于谷歌翻譯中,它的性能突飛猛進(jìn),表現(xiàn)非常出色,這種大規(guī)模應(yīng)用是學(xué)術(shù)界無法做到的,我們也看到了規(guī)模效應(yīng)的影響。谷歌翻譯在2016年取得的進(jìn)步,得益于注意力機(jī)制帶來的革命性改進(jìn)。

到了2017年,Transformer正式提出,其基本架構(gòu)是多層注意力機(jī)制的層層疊加,這項(xiàng)技術(shù)催生了現(xiàn)代大語言模型現(xiàn)代架構(gòu)。

回顧過去幾十年的工作,這些成果是比較突出的亮點(diǎn),被圖靈獎(jiǎng)提名委員會(huì)認(rèn)可,也是他們決定將2018年圖靈獎(jiǎng)授予我和Geoffrey Hinton、Yann LeCun的主要依據(jù)。當(dāng)然在此之外,我還完成了許多其它的工作。

與 Hinton、LeCun 一起越過寒冬:
我的學(xué)生曾擔(dān)心,和我一起研究神經(jīng)網(wǎng)絡(luò)會(huì)讓他們'畢業(yè)即失業(yè)'

在注意力機(jī)制、Transformer等相關(guān)技術(shù)出現(xiàn)之前,神經(jīng)網(wǎng)絡(luò)經(jīng)歷了一場(chǎng)寒冬,在所有人都對(duì)神經(jīng)網(wǎng)絡(luò)失去信心的時(shí)候,是什么讓您始終堅(jiān)持這個(gè)研究方向?

我有一種強(qiáng)烈的直覺,神經(jīng)網(wǎng)絡(luò)可以解決其他主流方法無法應(yīng)對(duì)的泛化問題。
許多統(tǒng)計(jì)方法都會(huì)嘗試使用不同單位或不同模式來覆蓋可能的輸入空間。問題在于,這種方法在低維度情況下效果很好,但是當(dāng)數(shù)據(jù)維度增加時(shí),傳統(tǒng)的統(tǒng)計(jì)方法可能會(huì)迅速失效,發(fā)生“維數(shù)災(zāi)難”。
通過對(duì)維數(shù)災(zāi)難進(jìn)行理論分析,我認(rèn)為神經(jīng)網(wǎng)絡(luò)有可能克服這個(gè)問題。神經(jīng)網(wǎng)絡(luò)的多層結(jié)構(gòu)使其能夠逐層提取和轉(zhuǎn)換輸入數(shù)據(jù)的特征,從而能用較少的自由度表示非常復(fù)雜的函數(shù)。因此,神經(jīng)網(wǎng)絡(luò)的深度讓它在處理高維度數(shù)據(jù)時(shí)具有巨大的優(yōu)勢(shì)。

圖片

2019年第7屆海德堡桂冠論壇(Heidelberg Laureate Forum, HLF)中,Yoshua Bengio發(fā)表題為“面向人工智能的深度學(xué)習(xí)(Deep Learning for AI)”的演講,演講中圍繞維數(shù)災(zāi)難(Curse of Dimensionality)問題展開探討。

在那段時(shí)間,你如何看待與其他研究人員發(fā)生沖突或不同意見?

是的,但大家都會(huì)很禮貌地表達(dá)不同意見。當(dāng)時(shí)在和審稿人溝通時(shí)有一些不愉快的經(jīng)歷。在2000年代,學(xué)術(shù)界對(duì)神經(jīng)網(wǎng)絡(luò)已經(jīng)不抱希望了。我們收到了一些來自審稿人的反饋說:“為什么你們還提交神經(jīng)網(wǎng)絡(luò)的論文?這個(gè)方向已經(jīng)被淘汰了?!蔽业膶W(xué)生們也會(huì)擔(dān)心,跟我一起研究神經(jīng)網(wǎng)絡(luò)會(huì)導(dǎo)致他們畢業(yè)后找不到工作。

現(xiàn)在的情況與當(dāng)時(shí)審稿人的看法大相徑庭?,F(xiàn)在,神經(jīng)網(wǎng)絡(luò)已經(jīng)成為人工智能的主流方法。

但我認(rèn)為把所有雞蛋放在一個(gè)籃子里的做法是錯(cuò)誤的,我們應(yīng)該探索更多不同的方法。在過去的七年里,我一直在努力探索當(dāng)前神經(jīng)網(wǎng)絡(luò)方法的局限性,這樣才能讓未來的人工智能具備當(dāng)前缺乏的能力。

那場(chǎng)有關(guān)神經(jīng)網(wǎng)絡(luò)的文化沙漠可能“勸退”了很多研究者,但我有點(diǎn)固執(zhí),堅(jiān)信我們應(yīng)該堅(jiān)持下去。那時(shí),我和一小群對(duì)神經(jīng)網(wǎng)絡(luò)保持堅(jiān)定信心的研究人員合作,包括我的同事Geoffrey Hinton、Yann LeCun,以及其他國家的幾個(gè)研究組。我和他們每年見面兩次,建立合作并交流想法,鼓勵(lì)彼此在神經(jīng)網(wǎng)絡(luò)這個(gè)研究方向上持續(xù)探索。

如果你在某條道路上踽踽獨(dú)行,可能會(huì)舉步維艱。但是擁有一群志同道合的朋友,共同堅(jiān)信我們走在正確的道路上,給我?guī)砹撕艽蟮膸椭?。此外,得益于加拿大高?jí)研究院CIFAR(編者注:CIFAR通過科學(xué)、技術(shù)、社會(huì)等領(lǐng)域科研項(xiàng)目合作的方式來吸引和資助世界各地的優(yōu)秀科研人員)對(duì)神經(jīng)網(wǎng)絡(luò)研究的資助,我最終能夠堅(jiān)持下來并取得了一些有用的成果。
與Geoffrey Hinton和Yann LeCun交流工作是什么樣的體驗(yàn)?會(huì)經(jīng)常發(fā)生思想上的碰撞嗎?
研究者之間想法各異是很正常的,這就是科學(xué)運(yùn)作的方式,新想法通常在求同存異的過程中產(chǎn)生。我們都有自己的實(shí)驗(yàn)室、有自己的學(xué)生,可以自由地做任何想做的事情。所以,我們從來不會(huì)評(píng)判誰是對(duì)的、誰是錯(cuò)的,也不會(huì)將自己的想法強(qiáng)加于其他人。
通過互相分享想法、觀點(diǎn)、論據(jù)和結(jié)果,借鑒彼此的想法和思維方式,我們都能從中獲益,并且能以彼此的工作成果為基礎(chǔ),不斷實(shí)現(xiàn)新的突破。
我和Hinton、LeCun專注于不同的研究方向、從事不同的研究工作,但我們享受這種交流。當(dāng)我產(chǎn)生了一個(gè)新的想法,我會(huì)非常樂于和他們分享。
圖片
2023年10月22日,Yann LeCun在社交媒體平臺(tái)X上發(fā)布合影,并發(fā)帖表示:提醒大家,人們可以在重要的事情上存在分歧,但仍然可以成為好朋友。合影中,Yoshua Bengio(左)、Geoffrey Hinton(中)、Yann LeCun(右)
在當(dāng)前的AI領(lǐng)域,你會(huì)推薦你的學(xué)生或合作者做什么研究?他們是否應(yīng)該追隨主流去從事改進(jìn)大模型相關(guān)的工作,還是按照自己的興趣探索一些不那么主流的研究問題呢?
在AI領(lǐng)域,我們需要那些致力于改進(jìn)現(xiàn)有成果的人,也需要自由探索全新思維方式的人,他們的研究貢獻(xiàn)會(huì)共同促進(jìn)AI的發(fā)展和進(jìn)步。
去做“第一個(gè)吃螃蟹的人”固然很難,因?yàn)闆]有即時(shí)的研究成果激勵(lì)他們堅(jiān)持下去。因此,需要建立支持研究者探索新想法、新路徑的社會(huì)機(jī)構(gòu),例如大學(xué),它允許一些人在自己感興趣的研究方向上花費(fèi)大量時(shí)間,即使它們可能根本行不通。
這就是科學(xué)研究的意義所在。研究者們嘗試各種方法,甚至將其作為終生事業(yè),或許無法作出改變世界的成果,但也有許多重要的想法在這個(gè)過程中問世。尤其當(dāng)未來充滿不確定性時(shí),我們需要這樣的探索。

不能把大模型的未來全押注在 Scaling Law之上,

對(duì)大模型和 AGI 保持謹(jǐn)慎樂觀

得益于Scaling Law,大模型性能持續(xù)提升。您如何看待大模型的未來發(fā)展?最終會(huì)通向何方?
沒有人能預(yù)測(cè)未來。順便澄清一下,Scaling Law并不是理論定律,它只是基于經(jīng)驗(yàn)性觀察總結(jié)出的規(guī)律。好比我們將數(shù)據(jù)繪制成點(diǎn)圖,并且擬合成一條直線,但我們不知道這條線會(huì)延伸多遠(yuǎn)、會(huì)在哪里停止。Scaling Law可能是一種可行的方法。但僅僅擴(kuò)大模型規(guī)??赡懿粔颍?yàn)槲覀儫o法確保Scaling Law能持續(xù)發(fā)揮作用。
所以,我們很難預(yù)測(cè)大模型未來會(huì)如何發(fā)展。但通常情況下,當(dāng)我們看到它呈現(xiàn)出良好的發(fā)展趨勢(shì)時(shí),可以對(duì)它抱以樂觀的期待。我和大多數(shù)人都相信,我們會(huì)持續(xù)看到大模型的進(jìn)步。不過當(dāng)然了,我過去也曾做出過錯(cuò)誤的判斷,我沒想到Scaling帶來了ChatGPT,這是我未曾想到的。
關(guān)于如何提升大模型的性能,AI領(lǐng)域的研究者們?nèi)匀淮嬖诤艽蟮姆制?。有人認(rèn)為,只需擴(kuò)大模型規(guī)模、增加算力和數(shù)據(jù)、提升計(jì)算效率等,就可以讓大模型達(dá)到與人類相同水平的能力。其他研究者則認(rèn)為,我們還需要在方法層面取得一些根本性突破,才能彌合人工智能與人類之間的差距。我的看法是,為了解決大模型目前存在的問題,我們需要探索 Scaling Law 之外的新方法。
我不想把大模型的未來押注在一項(xiàng)尚且沒有強(qiáng)有力證據(jù)來證明的事物(Scaling Law)之上。萬一擴(kuò)大模型規(guī)模不是提升模型性能的唯一法寶,我認(rèn)為需要做更充分的準(zhǔn)備。
無論如何,目前在全球范圍內(nèi),數(shù)千億美元的資金正在源源不斷地投入在提升大模型性能的研究上。除了Scaling之外,研究者們也在不斷改進(jìn)算法、硬件和數(shù)據(jù)集。所以我相信,我們一定會(huì)不斷取得進(jìn)步。
在未來五年里,我們可能會(huì)面臨很多挑戰(zhàn),研究進(jìn)展可能會(huì)比較緩慢。但我認(rèn)為從長遠(yuǎn)規(guī)劃和風(fēng)險(xiǎn)規(guī)避的角度來看,我們需要考慮所有可能性,并做好所有準(zhǔn)備工作。我們可以通過設(shè)立規(guī)章制度或開展學(xué)術(shù)研究,更好地了解大模型未來的發(fā)展方向,思考可能出現(xiàn)的問題以及如何減輕這些風(fēng)險(xiǎn)。
最近Yann LeCun公開表示,根據(jù)他對(duì)世界模型的看法,AGI不存在。你怎么看Yann的這個(gè)觀點(diǎn)?

AGI 在現(xiàn)階段當(dāng)然不存在,但在未來我們很可能會(huì)實(shí)現(xiàn) AGI,只是目前還沒有實(shí)現(xiàn)罷了。這是兩個(gè)不同的問題,Yann似乎在試圖回避關(guān)于未來AGI是否會(huì)存在的問題。但當(dāng)我問他時(shí),他也公開表示,他認(rèn)同我們正在朝著構(gòu)建AGI的方向前進(jìn)。

Yann不喜歡AGI這個(gè)詞,他更喜歡稱之為人類水平的AI。但重點(diǎn)是我們?cè)诓粩嗳〉眠M(jìn)步,因此有理由相信,未來一定會(huì)創(chuàng)造出在許多任務(wù)上和人類能力相當(dāng)?shù)臋C(jī)器?,F(xiàn)在在一些公開場(chǎng)合,Yann也認(rèn)同在未來幾年或幾十年可能實(shí)現(xiàn)AGI。但他始終強(qiáng)調(diào)我們還沒有發(fā)展到那個(gè)階段,所以不愿意討論風(fēng)險(xiǎn)問題。

問題在于,未來五年、十年或二十年AI會(huì)如何發(fā)展,以及這會(huì)給人類社會(huì)帶來怎樣的風(fēng)險(xiǎn)。

Ilya Sutskever在去年的訪談中曾表示OpenAI在制造AGI,你認(rèn)為這是在虛張聲勢(shì)嗎?

不,我不認(rèn)為這是虛張聲勢(shì)。Ilya真的打算實(shí)現(xiàn)這個(gè)目標(biāo),而且他在最近幾年取得了很多進(jìn)展。我們應(yīng)該認(rèn)真看待他的計(jì)劃?;蛟S現(xiàn)在Ilya不知道能否實(shí)現(xiàn)AGI,但重點(diǎn)是,這是他的目標(biāo),并且許多其他公司也有相同的目標(biāo)。所以我認(rèn)為這是一個(gè)認(rèn)真的目標(biāo),我們不應(yīng)該輕易地認(rèn)為這絕不可能實(shí)現(xiàn),因?yàn)槲覀円膊恢牢磥頃?huì)如何發(fā)展。 

所以這里形成了一個(gè)鮮明的對(duì)比,有些人把實(shí)現(xiàn)AGI視為他們的畢生目標(biāo),而另一些人則終生追求AI安全?

是的,人是多元化的。如果全人類能夠統(tǒng)一成同一個(gè)人、同一種思想,AI安全的問題就迎刃而解了,我們只需對(duì)AI的發(fā)展保持謹(jǐn)慎。問題在于,這世界上有許多人,每個(gè)人都有不同的思想,有些人會(huì)嘗試一些瘋狂的事情,可能需要全人類來承擔(dān)他們的行動(dòng)帶來的后果。這是一個(gè)很大的問題。

現(xiàn)階段研究重點(diǎn):

AI for science、系統(tǒng)2、AI安全

你的團(tuán)隊(duì)目前主要關(guān)注的研究問題是什么?

我關(guān)注的研究問題一直在轉(zhuǎn)變。我的很多學(xué)生仍然致力于構(gòu)建助力科學(xué)研究的人工智能,希望在醫(yī)療領(lǐng)域、應(yīng)對(duì)氣候變化,甚至是探索新的科學(xué)理論等方面發(fā)揮作用。我們利用人工智能來設(shè)計(jì)實(shí)驗(yàn)方案或建模,以便更好地理解現(xiàn)象或驗(yàn)證理論。這是我們過去一直致力于研究的問題。

大約七年前,我開始了一項(xiàng)關(guān)于系統(tǒng) 2 深度學(xué)習(xí)的研究,目前還有一些工作與這項(xiàng)研究相關(guān)(曾在智源大會(huì)介紹)。系統(tǒng) 1 類似于人類的直覺思維,當(dāng)前的人工智能系統(tǒng)似乎已經(jīng)掌握了這類能力,能夠迅速地給出答案。這種未經(jīng)深思熟慮給出的答案不一定是最理想的,但它的反應(yīng)速度非???。

系統(tǒng) 2 包括推理、因果關(guān)系、自我懷疑等思維能力,這些是當(dāng)前的人工智能不太擅長,而人類非常擅長的。因?yàn)閾碛羞@些能力,人類能夠在“分布外”的新環(huán)境中很好地“泛化”。我們可以通過系統(tǒng) 2 探索全新的問題解決方案。
圖片
系統(tǒng)1、系統(tǒng)2是Daniel Kahneman在《思考,快與慢》中提出的概念。系統(tǒng)1是指人類的直覺與自動(dòng)反應(yīng),易受到偏見和錯(cuò)誤判斷的影響;系統(tǒng)2則是人類的理性思考,負(fù)責(zé)處理復(fù)雜問題、計(jì)劃和決策。

近期,我的研究重點(diǎn)是人工智能安全(AI safety)。換言之,我們正在探索如何構(gòu)建不會(huì)傷害人類的AI系統(tǒng)。

事實(shí)上,很多論文或論據(jù)表明當(dāng)前的技術(shù)可能被用于構(gòu)建一些可能產(chǎn)生傷害人類動(dòng)機(jī)的 AI 系統(tǒng)。

我們需要構(gòu)建更安全的AI系統(tǒng),讓它與人類價(jià)值觀、意圖、法律、規(guī)范和道德保持一致,我們期待AI的行為符合人類的道德準(zhǔn)則。

關(guān)于AI安全問題,目前還沒有萬全的應(yīng)對(duì)之策。這很令人擔(dān)憂,因?yàn)楦鞔蠊菊诟?jìng)相加速開發(fā)更強(qiáng)大的AI系統(tǒng),卻沒有對(duì)“如何確保AI系統(tǒng)不會(huì)與人類為敵”這個(gè)問題投入足夠多的關(guān)注。

如果能回到20、30歲,

我會(huì)提醒年輕的自己注意AI風(fēng)險(xiǎn)

在前段時(shí)間的“北京AI安全國際對(duì)話”會(huì)議中,您談到AGI項(xiàng)目的擴(kuò)散問題和核武器問題非常相似。在您看來,AI的監(jiān)管和治理與核武器有何不同之處?

首先,我之所以將人工智能與核武器進(jìn)行對(duì)比,是因?yàn)閮烧叨季哂芯薮蟮牧α俊:嗽霞瓤梢杂糜谀茉瓷a(chǎn),也可能成為非常危險(xiǎn)的武器。AI也是這樣,強(qiáng)大的AI可以用于造福人類,也可能被用作武器。由于AI存在被濫用或失控的風(fēng)險(xiǎn),我們需要考慮如何避免重大災(zāi)難的發(fā)生。

AI與核武器的另一個(gè)相似之處在于,世界上核武器越多,發(fā)生不良事件的風(fēng)險(xiǎn)就越大,AI也是如此。與核不擴(kuò)散機(jī)制類似,我們應(yīng)該減少AGI項(xiàng)目的數(shù)量。但這很難實(shí)現(xiàn),因?yàn)楹芏鄧也辉阜艞壢魏涡问降闹鳈?quán)。但我認(rèn)為一旦各國政府意識(shí)到AI風(fēng)險(xiǎn)的嚴(yán)重程度,他們就會(huì)認(rèn)真對(duì)待AI安全治理問題,并且會(huì)意識(shí)到我們都同舟共濟(jì),存亡與共。

我們共同恐懼的是一種核武器的末日,即擁有核武器的國家之間互相毀滅。AI的發(fā)展和競(jìng)爭(zhēng)與之類似,無論你是哪個(gè)國家的公民,都將直面這場(chǎng)戰(zhàn)爭(zhēng)——這是人類與AI的戰(zhàn)爭(zhēng),而非國家與國家之間的對(duì)抗。

到那時(shí),無論你傾向于何種政治體制、信仰什么宗教、皮膚顏色如何,這些都無關(guān)緊要。我們都是人類,我們希望人類得以存續(xù)。為此,我們需要在所有國家之間找到協(xié)調(diào)一致的解決方案。

圖片

1945年原子彈在日本廣島和長崎爆炸后,原子彈之父奧本海默成為美國的“普羅米修斯”,他本人陷入深徹的反思與懊悔,對(duì)核武器濫用帶來的災(zāi)難性后果深感憂慮。


您是否想象過,如果AI或AGI達(dá)到超級(jí)智能狀態(tài)后,真的做出了殺害人類這樣的惡意行為,或者其濫用造成嚴(yán)重危害,我們應(yīng)該采取何種應(yīng)對(duì)措施來挽回這種局面?

是的,我非常擔(dān)心這個(gè)問題,因?yàn)槲覀兡壳斑€沒有找到應(yīng)對(duì)的方法。
 
AI帶來的災(zāi)難性后果可能比核武器更嚴(yán)重。因?yàn)槿绻贁?shù)核彈爆炸,可能會(huì)造成數(shù)百萬人死亡。盡管核武器帶來了大規(guī)模的傷害,但人類仍將繼續(xù)存在。但如果我們創(chuàng)造了一個(gè)超越人類智能的AI,并且它認(rèn)為自己在沒有人類干預(yù)的情況下能發(fā)展得更好,那么它可能會(huì)發(fā)明一種生物武器來殺死全人類。
 
在這場(chǎng)AI帶來的災(zāi)難中,沒有人可以幸免。我們不能坐以待斃,直至災(zāi)難降臨才開始思考應(yīng)對(duì)之策。
 
1945年原子彈在廣島爆炸以后,人們才開始感到恐慌,并終于意識(shí)到我們需要采取行動(dòng),以避免核武器造成更嚴(yán)重的后果。1946年,美國政府向聯(lián)合國原子能委員會(huì)提出了一份名為“巴魯克計(jì)劃”(Baruch Plan)的提案。巴魯克計(jì)劃主張?jiān)趪H層面統(tǒng)一管理核武器的研發(fā)工作,避免軍備競(jìng)賽。不幸的是,這個(gè)方案經(jīng)過幾年的討論和爭(zhēng)議,最終被聯(lián)合國安理會(huì)駁回了。?

圖片

聯(lián)合國原子能委員會(huì)于1946年6月14日舉行會(huì)議,伯納德·巴魯克提出“巴魯克計(jì)劃”提案

在AI治理方面,我們需要達(dá)成類似的國際條約,在國際層面達(dá)成共識(shí)。各國不應(yīng)毫無約束地自行研發(fā)人工智能技術(shù),尤其不能將AI用于軍事目的,而是應(yīng)該把所有資源集中起來構(gòu)建安全的AI,并確保它不會(huì)被用于對(duì)抗人類。

在此基礎(chǔ)上,我們可以共享AI帶來的好處。AI在醫(yī)療、環(huán)境、貧困問題等方面都可以帶來積極的影響,它也有潛力推動(dòng)科學(xué)領(lǐng)域的變革。因此,我們需要在享受AI帶來的進(jìn)步和避免AI帶來的災(zāi)難之間尋求平衡。

在AI安全上,我們不能各自為政,必須攜手同行。


Geoffrey Hinton在AI安全方面與您持有相同的觀點(diǎn),他甚至曾表示對(duì)自己的畢生工作感到后悔,那么我們應(yīng)該以悲觀還是樂觀的心態(tài)看待AI的發(fā)展?面對(duì)AI帶來的風(fēng)險(xiǎn)和威脅,你會(huì)不會(huì)對(duì)自己的工作感到后悔或遺憾呢?

我想,我應(yīng)該在過去的工作中更加重視AI可能帶來的風(fēng)險(xiǎn)。甚至在10年前,我就讀過聽過人們談?wù)揂I的風(fēng)險(xiǎn),但我并沒有給予足夠的重視。這是我曾犯下的錯(cuò)誤。

過去的就讓他過去吧,我們無法改變??傮w而言,我是一個(gè)樂觀主義者,但我也看到了AI可能帶來的巨大風(fēng)險(xiǎn)。樂觀還是悲觀,其實(shí)無關(guān)緊要。重要的問題是,我能做什么,我們每個(gè)人能為一個(gè)更好的世界做什么。

每個(gè)公民都可以有所作為。因?yàn)槿绻嗟墓褚庾R(shí)到了AI可能帶來的風(fēng)險(xiǎn),政府就會(huì)更加重視。在每個(gè)國家、每個(gè)政體中,政府都希望盡力獲得更多民意支持。

我會(huì)盡力而為。幸運(yùn)的是,我得到了很多認(rèn)可和支持,并且能夠在AI安全領(lǐng)域繼續(xù)開展研究。因此,我正在將更多精力轉(zhuǎn)移到這方面,盡我所能減少AI帶來的風(fēng)險(xiǎn)。


如果你有機(jī)會(huì)回到20歲或30歲,你想改變什么?
 
如果這是真的,我肯定可以向年輕的自己傳授很多經(jīng)驗(yàn),包括我對(duì)AI風(fēng)險(xiǎn)的認(rèn)識(shí)。

經(jīng)驗(yàn)豐富的人通常能發(fā)揮重要作用,但他們也可能因?yàn)楣虉?zhí)己見而作出錯(cuò)誤判斷。作為科學(xué)家,你可以選擇傾聽人們的意見,然后根據(jù)自己的經(jīng)驗(yàn)、知識(shí)來采納這些意見;你也可以不予理睬,等待時(shí)間去證明事情的真相。

我們不必全然相信經(jīng)驗(yàn)豐富之人給出的建議,但也不應(yīng)該完全忽視它。我們可以考慮多種可能性并提出假設(shè),然后通過實(shí)驗(yàn)研究來驗(yàn)證它們。這就是科學(xué)研究的工作方式。

所以你會(huì)提醒年輕的自己注意AI安全的風(fēng)險(xiǎn)?

是的,我會(huì)。

給年輕學(xué)者的建議:
善于發(fā)問,保持謙虛,持續(xù)閱讀

您在培養(yǎng)人工智能人才方面有非常豐富的經(jīng)驗(yàn)。在教學(xué)方面,這些年來您積累了哪些寶貴的實(shí)踐經(jīng)驗(yàn)?

這是一個(gè)有趣的問題。如果你是一個(gè)學(xué)生,有個(gè)教授在課堂上滔滔不絕了兩三個(gè)小時(shí),你的大腦會(huì)停止思考,你會(huì)跟不上老師講的內(nèi)容。如果只是讓學(xué)生被動(dòng)地聽課和接收知識(shí),很難刺激他們主動(dòng)思考。反之,如果有一種教學(xué)方式讓學(xué)生積極參與其中,迫使他們集中注意力傾聽其他人的想法,學(xué)習(xí)效果會(huì)更好。

?

從我的教學(xué)經(jīng)驗(yàn)來看,翻轉(zhuǎn)課堂(flipped class)行之有效。我會(huì)給學(xué)生們布置作業(yè),讓他們?cè)谡n前學(xué)習(xí)材料,在課堂上隨機(jī)選擇一些學(xué)生針對(duì)材料進(jìn)行課堂展示,其他學(xué)生需要提出問題或回答問題。這樣他們就幫我把活兒干了(笑)。

圖片

我的角色是確保學(xué)生們給出的答案是正確的,確保學(xué)生們真正理解了材料。而且過程里,大量任務(wù)由學(xué)生自主完成,這樣也保證了課堂活躍度。

此外,當(dāng)學(xué)生們?cè)诩依锟匆曨l或論文等材料自學(xué),可以按照自己的節(jié)奏來,累了就喝杯茶或咖啡,過會(huì)兒再來學(xué)。但教室里聽講,即使學(xué)生們無法集中精力課程也會(huì)繼續(xù),就會(huì)因此錯(cuò)過老師們講的內(nèi)容。所以我認(rèn)為傳統(tǒng)的講座并不是一種高效的教學(xué)方式。

相比之下,小組討論是一種更好的教學(xué)方法。比如我和我的三五個(gè)研究生,可能還有其他教授一起開展小組討論,更有助于我們互相學(xué)習(xí)和頭腦風(fēng)暴。

在教學(xué)過程中,我們必須擺脫“老師無所不知而學(xué)生一無所知,他們只需要吸收老師所給的學(xué)習(xí)材料”的傳統(tǒng)觀念。教學(xué)是一個(gè)對(duì)話的過程,需要由老師和學(xué)生共同參與。

圖片

Bengio在課堂教學(xué)中

對(duì)于處于職業(yè)發(fā)展和學(xué)術(shù)研究岔路口的年輕人,你會(huì)給他們哪些建議?

我有幾個(gè)建議想分享給年輕學(xué)者。

首先,對(duì)于研究者而言,善于提問是很重要的技能。如果你想從事學(xué)術(shù)研究,你必須對(duì)你所研究和討論的主題有深入的理解。有時(shí)我們讀到一些文章,我們會(huì)理所當(dāng)然地接受作者的觀點(diǎn),而不會(huì)去思考“它是如何運(yùn)作的?為什么有效?”這類問題。

我們不應(yīng)該未經(jīng)思考而輕易接受他人的觀點(diǎn),而是應(yīng)該試圖證明為什么這個(gè)結(jié)論是正確的,為什么作者會(huì)這樣寫,他們是否有證據(jù)可以證明自己得出的結(jié)論。如果沒有證據(jù),我們應(yīng)該持保留態(tài)度。也許有的人太自信了,比如Yann,他會(huì)非常篤定地講一些事。聽者會(huì)覺得,啊他一定是對(duì)的。人的直覺可能是錯(cuò)誤的,你需要有說服力的論據(jù)、有力的證據(jù)或?qū)嶒?yàn)結(jié)果來證明自己的觀點(diǎn)。研究的過程就是不斷提出問題。

下一個(gè)建議是,保持謙虛。你必須接受自己可能會(huì)犯錯(cuò)。在我的職業(yè)生涯中,關(guān)于哪些AI方法論或基礎(chǔ)理論會(huì)成功,我的想法改變了很多次,但這沒關(guān)系。

事實(shí)上,正是勇于承認(rèn)錯(cuò)誤才展現(xiàn)出你的聰明和謙遜,并且表明你充分認(rèn)識(shí)到自身知識(shí)的局限性。科學(xué)研究只有在你愿意改變想法、認(rèn)真傾聽并考慮他人觀點(diǎn)時(shí)才能取得進(jìn)展。也許其他人的觀點(diǎn)與你相悖,但他們可能是對(duì)的。

很多時(shí)候,沒有人知道正確答案,我們需要通過做實(shí)驗(yàn)或其他方法來尋找答案。如果無法確定,就不要篤信某一種觀點(diǎn)或結(jié)論。從事科學(xué)研究的人要學(xué)會(huì)接受現(xiàn)實(shí)可能存在多種解釋,所謂的認(rèn)知謙遜(epistemic humility)正是如此。

還有很多問題,我們無法從現(xiàn)存理論中找到答案。因此,研究者必須培養(yǎng)自己的直覺。培養(yǎng)直覺的有效方法之一是親身參與實(shí)踐。

親自動(dòng)手去做研究或工程項(xiàng)目,嘗試?yán)斫饽阏谶\(yùn)行的代碼,甚至通過重新編寫代碼來幫助自己加深對(duì)程序邏輯和運(yùn)行機(jī)制的理解,在大量的實(shí)踐或失敗中積累經(jīng)驗(yàn),從而建立更強(qiáng)的直覺,這是非常重要的。

最后一個(gè)建議是多閱讀。在任何知識(shí)領(lǐng)域中,每個(gè)人都像是一個(gè)微型大腦,通過閱讀可以了解他人的研究成果,研究思路和前沿進(jìn)展,從而持續(xù)積累關(guān)于這個(gè)領(lǐng)域的知識(shí)。這是一種日常訓(xùn)練,每天都要做。

閱讀論文很重要。面對(duì)領(lǐng)域中不斷新增的海量論文,你可能會(huì)覺得手足無措。因此,你在選擇論文的時(shí)候必須有所取舍,跟進(jìn)最重要的研究進(jìn)展。

你現(xiàn)在每天仍然會(huì)閱讀多少篇論文?

現(xiàn)在我必須非常高效地讀論文,因?yàn)橐x的內(nèi)容太多了,很多論文我甚至都不會(huì)完整地閱讀,只是大致瀏覽一下,看一下摘要和圖表。如果我對(duì)某篇文章的摘要很感興趣,就會(huì)更深入地閱讀這篇文章的內(nèi)容。所以我很難準(zhǔn)確計(jì)算每天閱讀論文的數(shù)量,但我確實(shí)每天都在堅(jiān)持讀論文。

不僅是論文,現(xiàn)在還有很多方式可以了解前沿研究進(jìn)展,比如通過博客文章等。我認(rèn)為更重要的是閱讀的時(shí)間,而不是數(shù)量。(如果非要說時(shí)間的話)三小時(shí)左右。


未來智能實(shí)驗(yàn)室的主要工作包括:建立AI智能系統(tǒng)智商評(píng)測(cè)體系,開展世界人工智能智商評(píng)測(cè);開展互聯(lián)網(wǎng)(城市)大腦研究計(jì)劃,構(gòu)建互聯(lián)網(wǎng)(城市)大腦技術(shù)和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務(wù)。每日推薦范圍未來科技發(fā)展趨勢(shì)的學(xué)習(xí)型文章。目前線上平臺(tái)已收藏上千篇精華前沿科技文章和報(bào)告。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多