Facebook研究機器人,是打的什么算盤?
這對Facebook有什么用呢?
Facebook在計算機視覺方面一直走在前列,正如我們在它的相機和圖像處理程序以及Portal等設備上看到的那樣,Potal會用它的“臉”跟著用戶在房間里轉(zhuǎn)來轉(zhuǎn)去。
雖然聽上去有些驚悚,但是好奇心對于這些需要了解他們所看到或感覺到的環(huán)境才能正常工作的應用程序來說都是至關(guān)重要的。
任何在應用程序或設備上運行的攝像頭,比如Facebook上的攝像頭,都在不斷地分析它所看到的圖像,以獲取有用的信息。
當一張臉進入畫面時,十幾個新的算法就會同時啟動并開始工作。如果有人舉起一個物體,攝像頭就會忙著分析:它有文字內(nèi)容嗎?需要翻譯嗎?有二維碼嗎?背景有多遠?
如果設備要及時完成這些任務,就會產(chǎn)生CPU使用率峰值、可見延遲以及用戶或系統(tǒng)工程師不希望出現(xiàn)的種種情況。
相反,如果人工智能助理在對場景感到不確定性時,發(fā)揮它的好奇心去檢查這些東西,確定分析物體的優(yōu)先級,是個相當不錯的折衷辦法。
通過觸摸感知
盡管視覺很重要,但它不是我們或機器人感知世界的唯一方式。許多機器人都配備了運動、聲音和其他形式的傳感器,但對物體的實際接觸相對較少。我們可以把它歸因于缺乏良好的觸覺接口。
盡管如此,F(xiàn)acebook的研究人員還是想研究使用觸覺數(shù)據(jù)代替視覺數(shù)據(jù)的可能性。
仔細想想,這完全是正常的,就像有視覺障礙的人用觸覺來了解周圍的環(huán)境,獲取關(guān)于物體的細節(jié)。
因此,F(xiàn)acebook的研究人員部署了一個人工智能模型,機器人根據(jù)視頻來決定采取什么行動,但不是實際的視頻數(shù)據(jù),而是給它輸入高分辨率的觸摸數(shù)據(jù)。
結(jié)果表明,該算法并不真正關(guān)心它是否像我們平時觀察世界的圖像,只要數(shù)據(jù)是以視覺方式呈現(xiàn)的,例如作為觸覺傳感器上的壓力圖,它就可以像圖像一樣分析該模式。
這對Facebook有什么用呢?
雖然Facebook對用戶接觸并沒有多大興趣。但這不僅僅是接觸的問題,而是跨模式應用學習。
試想你第一次看到兩個不同的物體,閉上眼睛,單靠觸摸就可以很容易地分辨出來。為什么會這樣?
因為當你看到某個東西時,你不只是觀察到它的樣子,還構(gòu)想了一個內(nèi)部模型來表示它,包含了多種感官和視角。
類似地,人工智能助理可能需要將其學習的內(nèi)容從一個領(lǐng)域轉(zhuǎn)移到另一個領(lǐng)域,比如說聽覺數(shù)據(jù)告訴握力傳感器如何握緊物體,或者視覺數(shù)據(jù)告訴麥克風如何分離聲音。
現(xiàn)實世界是一個復雜的環(huán)境,這里的數(shù)據(jù)更嘈雜,信息量更大。無論數(shù)據(jù)類型如何,都能夠利用這些數(shù)據(jù)對于可靠理解和與現(xiàn)實交互非常重要。
所以你會發(fā)現(xiàn),這些研究本有趣,而且事實上也很重要。正如描述這項研究的博客文章所言:“我們專注于使用機器人技術(shù),這不僅會生產(chǎn)出更有能力的機器人,還將在未來數(shù)年或者數(shù)十年內(nèi)挑戰(zhàn)人工智能的極限。如果我們想要更接近像人類那樣思考、計劃和推理的機器,那么我們需要構(gòu)建人工智能系統(tǒng),使其能夠在多種場景中自主學習,不僅僅是在虛擬的數(shù)字世界!
隨著各大網(wǎng)絡社交媒體不斷擴大其影響力,其應用程序和服務的的范圍涉及日常生活的方方面面,它對人工智能助力的要求也就越來越復雜。
雖然我們不會很快看到一個“Facebook機器人”,但未來可期。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預約>> OFweek 2025具身智能機器人產(chǎn)業(yè)技術(shù)創(chuàng)新應用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
8月5日立即報名>> 【在線會議】CAE優(yōu)化設計:醫(yī)療器械設計的應用案例與方案解析
推薦專題