深度學(xué)習(xí)中存在的偏見和歧視問題,不容忽視
當(dāng)人工智能技術(shù)落地到各個(gè)行業(yè)領(lǐng)域,深度學(xué)習(xí)作為人工智能技術(shù)的核心也逐漸滲透至各個(gè)方面。計(jì)算機(jī)通過模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,通過大量數(shù)據(jù)和算法獲取新的知識(shí)或技能,最后重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。
然而在人工智能上,一直存在“黑匣子”問題,深度網(wǎng)絡(luò)具有高預(yù)測(cè)能力但可解釋性不足的特點(diǎn)。在用大量數(shù)據(jù)“教導(dǎo)”機(jī)器學(xué)習(xí)的同時(shí),研究者發(fā)現(xiàn)機(jī)器學(xué)習(xí)也會(huì)產(chǎn)生不可預(yù)測(cè)性的“偏見”,當(dāng)一些暗含“偏見”的數(shù)據(jù)被算法永久性地編碼進(jìn)人工智能程序中,就可能導(dǎo)致未知的錯(cuò)誤和偏差,這可能會(huì)在最終結(jié)果和決策中產(chǎn)生影響甚至重大的錯(cuò)誤,從而影響未來人類與人工智能的關(guān)系。
前段時(shí)間,谷歌廢除了人工智能招聘項(xiàng)目,因?yàn)樵撊斯ぶ悄芟到y(tǒng)在經(jīng)過10年的簡(jiǎn)歷培訓(xùn)后,由于男性主導(dǎo)的工作環(huán)境,產(chǎn)生了對(duì)“女性”的偏見,據(jù)報(bào)道,它對(duì)包含“婦女”一詞或某些全女子學(xué)院名稱的簡(jiǎn)歷都進(jìn)行了處罰。
對(duì)于這種機(jī)器學(xué)習(xí)產(chǎn)生的“偏見”問題,類似于“俄羅斯坦克問題”。20世紀(jì)80年代,在機(jī)器學(xué)習(xí)發(fā)展的早期,美國(guó)軍方試圖訓(xùn)練一臺(tái)電腦來區(qū)分俄羅斯和美國(guó)坦克的照片。其分類準(zhǔn)確度非常高,但結(jié)果中俄羅斯坦克的所有照片都模糊不清,而美國(guó)坦克是高清晰度的。原來該算法最后不是在識(shí)別坦克,而是學(xué)習(xí)了如何區(qū)分模糊和清晰的照片。
而造成這種偏見的原因主要有一下幾點(diǎn):
一、用于機(jī)器學(xué)習(xí)算法的數(shù)據(jù)不足。算法在初始提供的數(shù)據(jù)中獲得模式,然后在新的數(shù)據(jù)中識(shí)別類似的模式,然而有時(shí)算法并不會(huì)按照人們初始意愿那樣工作。
二、算法本身很糟糕。機(jī)器學(xué)習(xí)是軟件開發(fā)人員利用大量與任務(wù)相關(guān)的數(shù)據(jù)訓(xùn)練 AI 算法的過程,如果本身算法就存在漏洞,深度學(xué)習(xí)后的結(jié)果則會(huì)更加差強(qiáng)人意。
要想消除機(jī)器學(xué)習(xí)中潛在的“偏見歧視”問題,可嘗試以下幾種方法。
減少原始數(shù)據(jù)的“偏見性”
2018年5月25日,“通用數(shù)據(jù)保護(hù)條例”(GDPR)在整個(gè)歐盟范圍內(nèi)生效,要求對(duì)組織如何處理個(gè)人數(shù)據(jù)進(jìn)行徹底改變。若違反GDPR條例的限制,相關(guān)組織必須支付高達(dá)2000萬(wàn)歐元或其全球收入4%的罰款(以較高者為準(zhǔn)),對(duì)威懾大多數(shù)違規(guī)行為具有很重要的意義。
但事實(shí)上,雖然有GDPR等法規(guī)對(duì)數(shù)據(jù)的使用加以限制,還是避免不了一些研究使用存在偏見的數(shù)據(jù)集。由于機(jī)器學(xué)習(xí)系統(tǒng)的行為由它學(xué)到的數(shù)據(jù)所驅(qū)動(dòng),所以它的工作方式與人們編寫的標(biāo)準(zhǔn)計(jì)算機(jī)程序有很大不同。如果供算法訓(xùn)練的數(shù)據(jù)不能公平地覆蓋所研究對(duì)象,系統(tǒng)便會(huì)出現(xiàn)偏差,甚至?xí)糯笤紨?shù)據(jù)中的偏見。
而這個(gè)問題卻不在數(shù)據(jù)本身的數(shù)學(xué)結(jié)構(gòu)上,而在于深度學(xué)習(xí)系統(tǒng)的設(shè)計(jì)者和操作者上。要解決數(shù)據(jù)的偏見問題,就需要數(shù)據(jù)收集存儲(chǔ)、使用的公平性和全面性。
打開算法“黑匣子”
一直以來,許多公司為了自身的專利保護(hù)和商業(yè)機(jī)密,會(huì)嚴(yán)格保密自家的人工智能算法,從未形成了決策無法解釋的“黑匣子”問題。好在目前人工智能領(lǐng)域已意識(shí)到這個(gè)問題,正積極采取措施加快代碼的開源,制定透明度標(biāo)準(zhǔn),提高算法的可靠性,除此之外,還需提倡“程序員必須對(duì)算法得出的結(jié)論做出解釋,否則就不能投入使用”原則。對(duì)此,人們也做出了相應(yīng)舉動(dòng),例如,美國(guó)國(guó)防部高級(jí)研究計(jì)劃局資助了一項(xiàng)名為XAI(可解釋的人工智能)的計(jì)劃,旨在打開人工智能的“黑匣子”,以保證用戶更好地控制人工智能程序。
讓機(jī)器自己尋找錯(cuò)誤
人工智能系統(tǒng)在學(xué)習(xí)時(shí)會(huì)犯錯(cuò)。事實(shí)上這是肯定的,所以稱之為“學(xué)習(xí)”。電腦只會(huì)從你給出的數(shù)據(jù)中學(xué)習(xí)。但有時(shí)候,并不能消除數(shù)據(jù)偏見的來源,就像不能消除人類中的偏見來源,所以首先承認(rèn)問題,然后讓機(jī)器自己去發(fā)現(xiàn)錯(cuò)誤。
華盛頓大學(xué)的研究人員在2016年構(gòu)建了一種稱為L(zhǎng)IME的解釋技術(shù),并在由Google構(gòu)建的圖像分類神經(jīng)網(wǎng)絡(luò)Inception Network上進(jìn)行了測(cè)試。
LIME在做出圖像分類決策時(shí),不會(huì)考慮觸發(fā)神經(jīng)網(wǎng)絡(luò)中的哪個(gè)神經(jīng)元,而是在圖像本身中搜索解釋。它會(huì)將原始圖像的不同部分變黑,并通過Inception將產(chǎn)生的“擾動(dòng)”圖像反饋回來,以檢查哪些擾動(dòng)導(dǎo)致結(jié)果偏離算法最遠(yuǎn)。通過解釋機(jī)器學(xué)習(xí)模式中的錯(cuò)誤,可以改進(jìn)技術(shù)來消除人的偏見。
深度學(xué)習(xí)的“偏見歧視”問題正潛移默化地影響著算法結(jié)果,研究者們需要時(shí)刻關(guān)注,反復(fù)檢測(cè)算法結(jié)果與預(yù)期的偏差,任何一點(diǎn)差距都有可能通過蝴蝶效應(yīng),最后發(fā)展成一個(gè)重要的錯(cuò)誤。在人工智能崛起的時(shí)代,當(dāng)人們?cè)絹碓疥P(guān)注人工智能與人類社會(huì)的關(guān)系時(shí),這將是一個(gè)始終備受關(guān)注的敏感點(diǎn)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市
- 7 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 8 “AI六小虎”到了下一個(gè)賽點(diǎn)
- 9 張勇等人退出阿里合伙人
- 10 AI視頻,攪動(dòng)1.5萬(wàn)億市場(chǎng)