什么是深度學(xué)習(xí)？

黃昌易 2019-03-18

展開全文

2012年9月，來自多倫多大學(xué)的兩位AI研究人員Alex Krizhevsky和Ilya Sutskever在ImageNet圖像識(shí)別比賽上創(chuàng)造了歷史。Krizhevsky和Sutskever，以及他們的導(dǎo)師(人工智能先驅(qū)Geoffrey Hinton)，他們提交了一種基于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的算法，這是一種人工智能技術(shù)，由于過去看來的有很多缺點(diǎn)，人工智能社區(qū)對(duì)此持懷疑態(tài)度。

由U of T研究人員開發(fā)的深度學(xué)習(xí)算法AlexNet能夠以15.3％的錯(cuò)誤率贏得比賽，比第二名高出10.8％。從某些方面來說，這一事件引發(fā)了深度學(xué)習(xí)革命，使許多學(xué)術(shù)和商業(yè)組織對(duì)該領(lǐng)域產(chǎn)生了興趣。

如今，深度學(xué)習(xí)已經(jīng)成為我們每天使用的許多應(yīng)用程序的關(guān)鍵，例如內(nèi)容推薦系統(tǒng)，翻譯應(yīng)用程序，數(shù)字助理，聊天機(jī)器人和面部識(shí)別系統(tǒng)。深度學(xué)習(xí)也有助于在醫(yī)療保健，教育和自動(dòng)駕駛汽車等許多特殊領(lǐng)域取得進(jìn)步。

深度學(xué)習(xí)的名聲也導(dǎo)致了對(duì)它是什么以及它能做什么的混淆和模糊。以下是深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的簡(jiǎn)要分析它們的優(yōu)勢(shì)和局限。

機(jī)器學(xué)習(xí)與經(jīng)典軟件的區(qū)別

深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集，AI的其中一個(gè)領(lǐng)域，它是改變了開發(fā)軟件的方式。開發(fā)軟件的經(jīng)典方式是程序員手動(dòng)編碼規(guī)定應(yīng)用程序的行為，這些經(jīng)典軟件現(xiàn)在也被成為“老式AI”。

經(jīng)典軟件在規(guī)則明確的領(lǐng)域中運(yùn)行良好，并且可以轉(zhuǎn)換為程序流命令，例如if ... else命令。但是，基于規(guī)則的系統(tǒng)在諸如計(jì)算機(jī)視覺等領(lǐng)域中則不太適用，因?yàn)橛?jì)算機(jī)視覺領(lǐng)域的軟件必須理解從不同角度和不同光照條件下拍攝的照片和視頻的內(nèi)容。

機(jī)器學(xué)習(xí)算法使用不同的數(shù)學(xué)和統(tǒng)計(jì)模型來分析大量數(shù)據(jù)，并找到有用的模式和相關(guān)性。然后，機(jī)器學(xué)習(xí)使用獲得的知識(shí)進(jìn)行預(yù)測(cè)或定義應(yīng)用程序的行為。

機(jī)器學(xué)習(xí)已經(jīng)使用了幾十年，但其功能在某些領(lǐng)域受到限制，仍然涉及大量勞動(dòng)密集型手工設(shè)計(jì)。例如，當(dāng)在計(jì)算機(jī)視覺中使用時(shí)，開發(fā)人員必須進(jìn)行大量“特征工程”，來使得算法能夠從圖像中提取不同的特征，然后再應(yīng)用統(tǒng)計(jì)模型(例如邏輯回歸或支持向量機(jī)SVM)。這個(gè)過程非常耗時(shí)，需要多名AI工程師和領(lǐng)域?qū)＜覅⑴c。

什么是深度學(xué)習(xí)？

經(jīng)典的機(jī)器學(xué)習(xí)方法涉及許多復(fù)雜的步驟，需要數(shù)十名領(lǐng)域?qū)＜?，?shù)學(xué)家和程序員的合作

神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)算法的原理

深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)和人工智能技術(shù)的不同之處在于它涉及的手工設(shè)計(jì)非常少。深度學(xué)習(xí)使用神經(jīng)網(wǎng)絡(luò)，可以解決大多數(shù)機(jī)器學(xué)習(xí)問題，而無需通過您之前的特定領(lǐng)域的特征工程。

當(dāng)您為神經(jīng)網(wǎng)絡(luò)提供一組示例（例如人物圖像）時(shí)，它可以找到這些圖像之間的共同特征。當(dāng)您將多個(gè)神經(jīng)網(wǎng)絡(luò)堆疊在一起時(shí)，它可以從找到簡(jiǎn)單的特征（如邊緣和輪廓）到更復(fù)雜的特征（如眼睛，鼻子，耳朵，面部和身體）。

什么是深度學(xué)習(xí)？

分層神經(jīng)網(wǎng)絡(luò)可以以分層方式從圖像中提取不同的特征（來源：www.deeplearningbook.o

在創(chuàng)建深度學(xué)習(xí)算法時(shí)，開發(fā)人員和工程師會(huì)配置層數(shù)和將每層輸出連接到下一層輸入的函數(shù)類型。接下來，他們通過提供大量帶注釋的示例來訓(xùn)練模型。例如，您給深度學(xué)習(xí)算法數(shù)千個(gè)圖像，其中包含與每個(gè)圖像的內(nèi)容相對(duì)應(yīng)的標(biāo)簽(即內(nèi)容標(biāo)注)。

深度學(xué)習(xí)算法將通過其分層神經(jīng)網(wǎng)絡(luò)運(yùn)行這些示例數(shù)據(jù)，并調(diào)整神經(jīng)網(wǎng)絡(luò)的每個(gè)層中的變量（或神經(jīng)元或激活）的權(quán)重以便能夠檢測(cè)到定義具有相似標(biāo)簽的圖像的常見模式。有許多層也是其被稱為“深度”學(xué)習(xí)的原因。通過足夠的訓(xùn)練，神經(jīng)網(wǎng)絡(luò)可以自己進(jìn)行微調(diào)，并且能夠根據(jù)從示例中獲得的知識(shí)對(duì)未標(biāo)記的圖像進(jìn)行分類判斷。

尋找高質(zhì)量的訓(xùn)練數(shù)據(jù)是深度學(xué)習(xí)算法的主要挑戰(zhàn)之一。幸運(yùn)的是，深度學(xué)習(xí)工程師可以選擇許多公開可用的數(shù)據(jù)集。其中一個(gè)例子是ImageNet數(shù)據(jù)庫，它包含20萬個(gè)標(biāo)注類別，超過1400萬張圖片。ImageNet是培訓(xùn)和測(cè)試計(jì)算機(jī)視覺算法的事實(shí)標(biāo)準(zhǔn)之一。其他數(shù)據(jù)集包括CIFAR（另一種通用計(jì)算機(jī)視覺數(shù)據(jù)集）和MNIST（一種由數(shù)萬個(gè)手寫數(shù)字組成的專用數(shù)據(jù)庫）。

有監(jiān)督，無監(jiān)督和強(qiáng)化學(xué)習(xí)

什么是深度學(xué)習(xí)？

上述過程稱為“監(jiān)督學(xué)習(xí)”，它是目前開發(fā)深度學(xué)習(xí)算法的主要方式。它被稱為監(jiān)督，因?yàn)锳I模型被給予一整套問題（例如圖像）及其解決方案（例如它們的相關(guān)標(biāo)簽或描述），并被指示在輸入和輸出之間找到正確的映射。監(jiān)督學(xué)習(xí)用于諸如計(jì)算機(jī)視覺和語音識(shí)別之類的領(lǐng)域。

無監(jiān)督學(xué)習(xí)是另一種深度學(xué)習(xí)模型，用于解決您擁有大量數(shù)據(jù)的問題，但是您沒有相應(yīng)的輸出來映射它們。在這種情況下，深度學(xué)習(xí)算法必須仔細(xì)閱讀訓(xùn)練數(shù)據(jù)并找到有用的模式，否則這些模式需要大量的人力。

例如，深度學(xué)習(xí)算法可以獲得10年的銷售數(shù)據(jù)，并為您提供有關(guān)如何調(diào)整商品價(jià)格以最大化銷售額的銷售預(yù)測(cè)或建議。這些被稱為預(yù)測(cè)性和規(guī)范性分析，在許多領(lǐng)域都很有用，例如天氣預(yù)報(bào)和內(nèi)容推薦。

強(qiáng)化學(xué)習(xí)，另一種深度學(xué)習(xí)模式訓(xùn)練，被許多人視為“人工智能的圣杯”。在強(qiáng)化學(xué)習(xí)中，AI模型提供了問題域的基本規(guī)則，并且可以在沒有人類監(jiān)督或數(shù)據(jù)的情況下自行發(fā)展其行為。

強(qiáng)化學(xué)習(xí)是開發(fā)人工智能模型的主要方法之一，這些模型已經(jīng)掌握了著名的游戲，如國(guó)際象棋，圍棋，撲克，以及最近的星際爭(zhēng)霸II?？茖W(xué)家們還利用強(qiáng)化學(xué)習(xí)來開發(fā)機(jī)器人手，教他們自己處理物體，這是人工智能行業(yè)面臨的嚴(yán)峻挑戰(zhàn)之一。盡管強(qiáng)化學(xué)習(xí)是AI的一個(gè)非常令人興奮的領(lǐng)域，但它也具有非常明顯的限制，并且在計(jì)算資源方面要求很高。強(qiáng)化學(xué)習(xí)在實(shí)驗(yàn)室中表現(xiàn)非常有趣，但它在現(xiàn)實(shí)世界的應(yīng)用中表現(xiàn)還比較有限。

深度學(xué)習(xí)在現(xiàn)在成為可能的原因

雖然深度學(xué)習(xí)在近十年早些時(shí)候開始流行，但它并不新鮮。神經(jīng)網(wǎng)絡(luò)的概念可以追溯到20世紀(jì)50年代，當(dāng)時(shí)第一個(gè)神經(jīng)網(wǎng)絡(luò)Mark I Perceptron被開發(fā)出來。

神經(jīng)網(wǎng)絡(luò)也在20世紀(jì)80年代和90年代被討論過，但由于它們的性能有限以及它們的數(shù)據(jù)和計(jì)算能力的需求而最終放棄。當(dāng)時(shí)，創(chuàng)建深度學(xué)習(xí)模型所需的數(shù)據(jù)和計(jì)算資源不夠用，訓(xùn)練深度學(xué)習(xí)模型需要大量時(shí)，使用其他方法在資源需求和結(jié)果方面更為現(xiàn)實(shí)。

什么是深度學(xué)習(xí)？

Mark I Perceptron是1957年神經(jīng)網(wǎng)絡(luò)的第一個(gè)實(shí)現(xiàn)（來源：維基百科）

現(xiàn)在，數(shù)據(jù)和計(jì)算都已廣泛可用且價(jià)格低廉。有大量的GPU和專用硬件可以幫助以非?？斓乃俣扔?xùn)練深度學(xué)習(xí)模型。PaperSpace和Crestle等云計(jì)算服務(wù)專門用于深度學(xué)習(xí)。

深度學(xué)習(xí)的應(yīng)用

深度學(xué)習(xí)目前已進(jìn)入許多不同領(lǐng)域。以下是深度學(xué)習(xí)的一些熱門應(yīng)用：

自動(dòng)駕駛汽車
：為了在沒有駕駛員的情況下駕駛，自動(dòng)駕駛汽車需要能夠理解周圍環(huán)境。深度學(xué)習(xí)算法從安裝在汽車周圍的攝像機(jī)攝取視頻信號(hào)，并檢測(cè)路牌，交通信號(hào)燈，其他汽車和行人。深度學(xué)習(xí)是無人駕駛汽車的主要組成部分之一（但不是唯一的）。
面部識(shí)別
：面部識(shí)別目前用于許多不同的領(lǐng)域，例如解鎖iPhone，付款和查找罪犯。以前的技術(shù)迭代需要大量的手動(dòng)工作，并且不太可靠。通過深度學(xué)習(xí)，面部識(shí)別系統(tǒng)僅需要查看一個(gè)人的幾個(gè)圖像，并且能夠以實(shí)時(shí)和準(zhǔn)確的方式實(shí)時(shí)檢測(cè)該人的面部照片和視頻。基于人工智能的面部識(shí)別目前處于道德辯論的中心，因?yàn)樗哂袧撛诘碾U(xiǎn)惡用途。
語音識(shí)別和轉(zhuǎn)錄
：訓(xùn)練有素的深度學(xué)習(xí)模型可以將音頻流轉(zhuǎn)換為書面文本，并且比以前的任何轉(zhuǎn)錄技術(shù)都更加準(zhǔn)確。深度學(xué)習(xí)使智能揚(yáng)聲器能夠解析用戶提供的語音命令。除了抄寫文本之外，深度學(xué)習(xí)還可以幫助區(qū)分不同人的聲音并確定誰在說話。
機(jī)器翻譯
：在深度學(xué)習(xí)之前，自動(dòng)翻譯系統(tǒng)的質(zhì)量非常有限，并且很難開發(fā)，需要為每種語言對(duì)單獨(dú)進(jìn)行。近年來，谷歌等科技巨頭一直在使用深度學(xué)習(xí)來提高機(jī)器翻譯系統(tǒng)的質(zhì)量。深度學(xué)習(xí)對(duì)人類語言的理解是有限的，但它在簡(jiǎn)單的翻譯中表現(xiàn)得非常好。
醫(yī)學(xué)成像
：深度學(xué)習(xí)模型可以幫助醫(yī)生自動(dòng)化分析X射線和MRI掃描，發(fā)現(xiàn)癥狀和診斷疾病的過程。深度學(xué)習(xí)不會(huì)取代放射科醫(yī)師，但肯定會(huì)幫助他們?cè)诠ぷ髦凶兊酶谩?/p>

深度學(xué)習(xí)的局限

什么是深度學(xué)習(xí)？

由引腳和線創(chuàng)建的神經(jīng)網(wǎng)絡(luò)

深度學(xué)習(xí)解決了許多以前被認(rèn)為是計(jì)算機(jī)禁區(qū)的問題，但深度學(xué)習(xí)的成就也導(dǎo)致了許多錯(cuò)誤的解釋和對(duì)其能力的過高期望。雖然深度學(xué)習(xí)是一項(xiàng)非常令人興奮的技術(shù)，但它也有明顯的限制。

優(yōu)步人工智能的前負(fù)責(zé)人、紐約大學(xué)教授加里·馬庫斯，在他的深度論文《深度學(xué)習(xí)：批判性評(píng)價(jià) 》中，詳細(xì)介紹了深度學(xué)習(xí)的局限性和挑戰(zhàn)，總結(jié)為以下幾點(diǎn)。：

深度學(xué)習(xí)需要大量數(shù)據(jù)
。與人類不同，他們可以根據(jù)有限和不完整的數(shù)據(jù)學(xué)習(xí)概念并做出可靠的決策，深度學(xué)習(xí)模型通常只能與他們接受培訓(xùn)的數(shù)據(jù)的質(zhì)量和數(shù)量一樣好。這在標(biāo)注數(shù)據(jù)不可用的領(lǐng)域中構(gòu)成限制。
深度學(xué)習(xí)模型很淺
：深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)在訓(xùn)練之外的領(lǐng)域應(yīng)用知識(shí)的能力非常有限，并且當(dāng)他們?cè)谟?xùn)練過的狹窄領(lǐng)域之外使用時(shí)，他們可能以驚人和危險(xiǎn)的方式失敗。
深度學(xué)習(xí)是不透明的
：與其他機(jī)器學(xué)習(xí)模型不同，深度學(xué)習(xí)涉及非常少的自上而下的人類設(shè)計(jì)。它們也非常復(fù)雜，涉及數(shù)千和數(shù)百萬個(gè)參數(shù)。這使得很難解釋他們的輸出和他們決定背后的原因。由于它們的不透明性，神經(jīng)網(wǎng)絡(luò)被描述為黑盒子。這個(gè)問題引發(fā)了一系列努力和研究，以創(chuàng)建可解釋的人工智能。

深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)通常與人類智能進(jìn)行比較。但是，雖然深度學(xué)習(xí)可以執(zhí)行一些與人類相同或更好的復(fù)雜任務(wù)，但它的工作方式與人類思維有著根本不同。它在常識(shí)和抽象決策中特別受到限制。

深度學(xué)習(xí)的威脅

深度學(xué)習(xí)是一個(gè)非常強(qiáng)大的工具。但與其他所有有效技術(shù)一樣，它也有自己的缺陷。

深度學(xué)習(xí)模型容易出現(xiàn)算法偏差，因?yàn)樗鼜挠?xùn)練數(shù)據(jù)中得出其行為。這意味著嵌入在訓(xùn)練樣例中的任何隱藏或明顯的偏差也將進(jìn)入深度學(xué)習(xí)算法所做的決策。

在過去幾年中，有幾個(gè)案例發(fā)現(xiàn)深度學(xué)習(xí)模式歧視特定人群。例如，去年10月，亞馬遜不得不關(guān)閉AI招聘工具，因?yàn)樗鼘?duì)女性申請(qǐng)人有偏見。

在錯(cuò)誤的人手中，深度學(xué)習(xí)可以服務(wù)于非常邪惡的目的。隨著深度學(xué)習(xí)在創(chuàng)建自然的圖像和聲音方面變得越來越有效，人們擔(dān)心該技術(shù)可能會(huì)被用于創(chuàng)建一種新的基于AI的偽造犯罪。去年，關(guān)于FakeApp的爭(zhēng)議很多，F(xiàn)akeApp是一個(gè)使用深度學(xué)習(xí)來交換視頻中人物面孔的視頻應(yīng)用程序。有人用該應(yīng)用程序?qū)⒚撕驼偷拿婵字糜谏橐曨l中。

深度學(xué)習(xí)的另一個(gè)威脅是對(duì)抗性攻擊。由于它們的創(chuàng)建方式，深度學(xué)習(xí)算法可以以意想不到的方式運(yùn)行 - 或者至少以對(duì)我們?nèi)祟悂碚f似乎不合邏輯的方式運(yùn)行。鑒于神經(jīng)網(wǎng)絡(luò)的不透明性，很難找到它們包含的所有邏輯錯(cuò)誤。

專家和研究人員一再表明，這些失敗可能會(huì)變成對(duì)抗性攻擊－－惡意行為者強(qiáng)迫深層學(xué)習(xí)算法表現(xiàn)出危險(xiǎn)的行為。例如，研究人員能夠通過在停車標(biāo)志上粘貼幾個(gè)彩色貼紙來欺騙自動(dòng)駕駛汽車的視覺算法。對(duì)于人類來說，它仍然看起來像一個(gè)停止標(biāo)志，但無人駕駛汽車會(huì)完全錯(cuò)過并可能造成危險(xiǎn)的情況。

深度學(xué)習(xí)只是一個(gè)開始

由于Krizhevsky，Sutskever和Hinton以及其他許多在該領(lǐng)域工作過的人的努力，深度學(xué)習(xí)已經(jīng)走了很長(zhǎng)一段路。

但深層學(xué)習(xí)仍然不是人工智能的實(shí)現(xiàn)，而是創(chuàng)造出能夠像人類一樣思考的合成物。我們甚至不知道是否能創(chuàng)造人工智能，許多專家認(rèn)為這是一個(gè)浪費(fèi)的目標(biāo)。

然而，就科學(xué)家而言，我們?nèi)匀恍枰苿?dòng)創(chuàng)造更好的技術(shù)和技術(shù)，以實(shí)現(xiàn)復(fù)雜的決策自動(dòng)化。2017年，作為深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的長(zhǎng)期開拓者和倡導(dǎo)者的Hinton，建議為拋棄他創(chuàng)造的所有東西并重新開始做好準(zhǔn)備。

Hinton說：“未來取決于一些對(duì)我所說的一切都深表懷疑的研究生！”。

---正文完---

什么是深度學(xué)習(xí)？

評(píng)論區(qū)互動(dòng)：字符畫 -- 猜猜看

【科技生活范：在生活中了解科技，用科技方便生活！】

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：黃昌易 > 《商企管理》

舉報(bào)/認(rèn)領(lǐng)