我們真的永遠(yuǎn)也理解不了人工智能嗎?
現(xiàn)代機(jī)器學(xué)習(xí)技術(shù)為開發(fā)者提供了不同的選擇:究竟是要精確獲知結(jié)果,還是要以犧牲精確度為代價、了解出現(xiàn)該結(jié)果的原因?“了解原因”可幫助我們制定策略、做出適應(yīng)、并預(yù)測模型何時可能失靈。而“獲知結(jié)果”則能幫助我們即刻采取恰當(dāng)行動。
這實在令人左右為難。但一些研究人員提出,如果既能保留深度網(wǎng)絡(luò)的多層構(gòu)造、又能理解其運作原理,豈不是最好?令人驚奇的是,一些最受看好的研究所其實是將神經(jīng)網(wǎng)絡(luò)作為實驗對象看待的,即沿襲生物科學(xué)的思路,而不是將其視作純數(shù)學(xué)的研究對象。尤辛斯基也表示,他試圖“通過我們了解動物、甚至人類的方式來了解深度網(wǎng)絡(luò)!彼推渌嬎銠C(jī)科學(xué)家借鑒了生物研究技術(shù),借神經(jīng)科學(xué)家研究人腦的方式研究神經(jīng)網(wǎng)絡(luò):對各個部件展開詳細(xì)分析,記錄各部件內(nèi)部對微小輸入變化的反應(yīng),甚至還會移除某些部分、觀察其余部分如何進(jìn)行彌補(bǔ)。
在從無到有地打造了一種新型智能之后,科學(xué)家如今又將其拆開,用數(shù)字形式的“顯微鏡”和“手術(shù)刀”對這些“虛擬器官”展開分析。
尤辛斯基坐在一臺電腦前、對著網(wǎng)絡(luò)攝像頭說話。攝像頭接收的數(shù)據(jù)被輸入深度神經(jīng)網(wǎng)絡(luò),而與此同時,該網(wǎng)絡(luò)也在由尤辛斯基和同事們開發(fā)的Deep Visualization(深度可視化)軟件工具包進(jìn)行分析。尤辛斯基在幾個屏幕間來回切換,然后將網(wǎng)絡(luò)中的一個神經(jīng)元放大!斑@個神經(jīng)元似乎能夠?qū)γ娌繄D像做出反應(yīng)。”人腦中也有這種神經(jīng)元,其中多數(shù)都集中在一處名為“梭狀臉區(qū)”的腦區(qū)中。該腦區(qū)最早由1992年開始的一系列研究發(fā)現(xiàn),被視作人類神經(jīng)科學(xué)最可靠的觀察結(jié)果之一。對腦區(qū)的研究還需借助正電子發(fā)射計算機(jī)斷層掃描等先進(jìn)技術(shù),但尤辛斯基只需憑借代碼、便可對人造神經(jīng)元展開詳細(xì)分析。
借助該方法,尤辛斯基可將特定的人造神經(jīng)元與人類能理解的概念或物體(如人臉)建立起映射關(guān)系,從而將神經(jīng)網(wǎng)絡(luò)變?yōu)橛辛ぞ。該研究還挑明了圖片中最容易激發(fā)面部神經(jīng)元反映的特征!把劬︻伾缴、嘴唇越紅,神經(jīng)元的反應(yīng)就更為強(qiáng)烈!
杜克大學(xué)計算機(jī)科學(xué)、電子與計算機(jī)工程教授辛西婭·魯丁認(rèn)為,這些“事后解讀”本身是有問題的。她的研究重點為以規(guī)則為基礎(chǔ)的機(jī)器學(xué)習(xí)系統(tǒng),可應(yīng)用于罪犯量刑、醫(yī)療診斷等領(lǐng)域。在這些領(lǐng)域中,人類能夠進(jìn)行解讀,且人類的解讀十分關(guān)鍵。但在視覺成像等領(lǐng)域,“個人的解讀結(jié)果純屬主觀!闭\然,我們可以通過識別面部神經(jīng)元、對神經(jīng)網(wǎng)絡(luò)的響應(yīng)進(jìn)行簡化,但如何才能確定這就是該網(wǎng)絡(luò)尋找的結(jié)果呢?無獨有偶,有一套著名理論認(rèn)為,不存在比人類視覺系統(tǒng)更簡單的視覺系統(tǒng)模型!皩τ谝粋復(fù)雜系統(tǒng)在做什么事情,可以有很多種解釋,”魯丁指出,“難道從中選出一個你‘希望’正確的解釋就行了嗎?”
尤辛斯基的工具包可以通過逆向工程的方式、找出神經(jīng)網(wǎng)絡(luò)自身“希望”正確的結(jié)果,從而在部分程度上解決上述問題。該項目先從毫無意義的“雪花”圖像開始,然后對像素進(jìn)行逐個調(diào)整,通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練的反向過程逐步修改圖片,最終找出能夠最大限度激發(fā)某個神經(jīng)元響應(yīng)的圖片。將該方法運用到AlexNet神經(jīng)元上后,該系統(tǒng)生成了一些奇奇怪怪的照片,雖然看上去頗為詭異,但的確能看出屬于它們被標(biāo)記的類別。
這似乎支持了尤辛斯基的論斷:這些面部神經(jīng)元尋找的確實是面部圖像。但還有一個問題:在生成這些圖像的過程中,該流程依賴了一種名為“自然圖像優(yōu)先”的統(tǒng)計學(xué)約束,因此其生成的圖像均會模仿真實物體照片的結(jié)構(gòu)。而當(dāng)他去除這些規(guī)則后,該工具包仍會選取被其標(biāo)記為“信度最大”的圖片,但這些圖片看上去就像電視機(jī)失去信號時的“雪花”一樣。事實上,尤辛斯基指出,AlexNet傾向于選擇的大部分圖片在人眼看來都是一片亂糟糟的“雪花”。他承認(rèn)道:“很容易弄清如何讓神經(jīng)網(wǎng)絡(luò)生成極端結(jié)果!
圖為深度神經(jīng)網(wǎng)絡(luò)中的單個神經(jīng)元(由綠框標(biāo)出)對尤辛斯基的面部圖像做出反應(yīng),就像人腦的某個腦區(qū)(標(biāo)為黃色)也會對面部圖像做出反應(yīng)一樣
為避免這些問題,弗吉尼亞理工大學(xué)電子與計算機(jī)工程助理教授杜魯夫·巴特拉采用了一種更高級的實驗方法對深度網(wǎng)絡(luò)進(jìn)行解讀。他沒有去試圖尋找網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)的規(guī)律,而是用一種眼動追蹤技術(shù)分析神經(jīng)網(wǎng)絡(luò)的行為。在研究生阿比謝克·達(dá)斯和哈什·阿格拉瓦爾的帶領(lǐng)下,巴特拉的團(tuán)隊向一個深度網(wǎng)絡(luò)就某張圖片提問,如房間窗戶上是否有窗簾等等。不同于AlexNet或類似系統(tǒng),達(dá)斯的網(wǎng)絡(luò)每次只關(guān)注圖片的一小部分,然后“掃視”圖片各處,直到該網(wǎng)絡(luò)認(rèn)為已經(jīng)得到了足夠的信息、可以回答問題為止。經(jīng)過充分訓(xùn)練后,這一深度神經(jīng)網(wǎng)絡(luò)的表現(xiàn)已經(jīng)非常出色,精確度足以與人類的最高水平媲美。
接下來,達(dá)斯、巴特拉和同事們還想了解該網(wǎng)絡(luò)是如何做出決策的。于是他們分析了該網(wǎng)絡(luò)在圖片上選取的觀察點。而結(jié)果令他們大吃一驚:在回答“圖中是否有窗簾”的問題時,該網(wǎng)絡(luò)根本沒去尋找窗戶,而是先對圖片底部進(jìn)行觀察,如果發(fā)現(xiàn)了床鋪,就停下來不找了?磥碓谟脕碛(xùn)練該網(wǎng)絡(luò)的數(shù)據(jù)集中,裝有窗簾的窗戶可能常出現(xiàn)在臥室里。
該方法雖然揭露了深度網(wǎng)絡(luò)的一些內(nèi)部運行機(jī)制,但也凸顯了可解釋性帶來的挑戰(zhàn)。巴特拉指出:“機(jī)器捕捉到的并不是關(guān)于這個世界的真相,而是關(guān)于數(shù)據(jù)集的真相!边@些機(jī)器嚴(yán)格按照訓(xùn)練數(shù)據(jù)進(jìn)行了調(diào)整,因此很難總結(jié)出它們運作機(jī)制的普遍規(guī)則。更重要的是,你要是不懂它如何運作,就無法預(yù)知它會如何失靈。而從巴特拉的經(jīng)驗來看,當(dāng)它們失靈的時候,“就會輸?shù)靡粩⊥康!?/p>
圖為“深度視覺化”工具包生成的“理想貓臉”。該程序先從類似電視機(jī)沒信號時的“雪花”圖像開始,對像素進(jìn)行逐個調(diào)整,直到AlexNet神經(jīng)網(wǎng)絡(luò)的面部神經(jīng)元產(chǎn)生最大響應(yīng)為止
尤辛斯基和巴特拉等研究人員面臨的一些障礙對人腦科學(xué)家來說也并不陌生。例如,對神經(jīng)成像的解讀就常常遭到質(zhì)疑。2014年,認(rèn)知神經(jīng)科學(xué)家瑪莎·法拉在一篇領(lǐng)域評述中寫道:“令人擔(dān)憂的是……(功能性腦部)圖像更像是研究人員的創(chuàng)造發(fā)明、而非觀察結(jié)果!边@一問題在各種智能系統(tǒng)中也屢屢出現(xiàn),說明無論對人腦、還是對智能的研究而言,該問題都會成為一大障礙。
追求可解釋性是否為一項愚蠢之舉呢?2015年,加州大學(xué)圣地亞哥分校的扎克利·立頓發(fā)表了一篇名為《模型可解釋性的迷思》的博文,批判性地探討了解讀神經(jīng)網(wǎng)絡(luò)背后的動機(jī)、以及為大型數(shù)據(jù)集打造可解讀的機(jī)器學(xué)習(xí)模型的價值。在2016年國際機(jī)器學(xué)習(xí)大會(ICML)上,他還向馬里奧托夫與兩名同事組織的“人類可解釋性”專題研討會提交了一篇與該話題相關(guān)的、頗具爭議性的論文。
立頓指出,許多學(xué)者并不贊同“可解釋性”這一概念。因此他認(rèn)為,要么是人們對可解釋性的理解還不夠,要么是它有太多可能的含義。無論是哪種情況,追求可解釋性也許都無法滿足我們對“簡單易懂的神經(jīng)網(wǎng)絡(luò)輸出”的渴求。立頓在博文中指出,當(dāng)數(shù)據(jù)集過大時,研究人員完全可以抑制去解讀的沖動,要相信“憑借經(jīng)驗也能成功”。他表示,該領(lǐng)域的目的之一,便是要“打造學(xué)習(xí)能力遠(yuǎn)超人類的模型”,如果太過注重可解釋性,就難以使這類模型充分發(fā)揮潛力。
但這種能力既是特點也是缺陷:如果我們不明白網(wǎng)絡(luò)輸出是如何生成的,就無從知曉該網(wǎng)絡(luò)需要何種輸入。1996年,英國蘇塞克斯大學(xué)的艾德里安·湯普森采用與如今訓(xùn)練深度網(wǎng)絡(luò)相似的技術(shù)、用軟件設(shè)計了一款電路。這一電路要執(zhí)行的任務(wù)很簡單:區(qū)分兩個音頻的音調(diào)。經(jīng)過成千上萬次調(diào)整和重排后,該軟件終于找到了一種能近乎完美地完成任務(wù)的配置。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
8月5日立即報名>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應(yīng)用案例與方案解析
推薦專題