深入Facebook全新機(jī)器人實(shí)驗(yàn)室:AI與機(jī)器共織未來
乍一看,F(xiàn)acebook新生的機(jī)器人平臺看起來有點(diǎn)混亂。在這家公司硅谷總部的一個(gè)新實(shí)驗(yàn)室里,一只紅黑相間的Sawyer機(jī)器人手臂(來自最近倒閉的Rethink Robotics)不斷揮舞著,發(fā)出嗚嗚的機(jī)械聲。照理說,它應(yīng)該可以把手臂移動到右邊空間中的一個(gè)位置,但是它卻向上移動,偏離設(shè)置的方向,并重置到起始位置。終于,它的手臂向右移動了,非常接近目標(biāo)位置。但是,它卻再次瘋狂地偏離了方向,不得不被再次重置。
不過,就像一只兔子為了躲避獵鷹而來回曲折,這個(gè)機(jī)器人看似瘋狂實(shí)際上卻是很聰明的。Facebook認(rèn)為它既是開發(fā)更好機(jī)器人,也是開發(fā)更好人工智能的關(guān)鍵。也就是說,這個(gè)機(jī)器人正在自學(xué)探索世界。Facebook表示,未來有一天,將會出現(xiàn)像遠(yuǎn)程呈現(xiàn)機(jī)器人一樣的智能機(jī)器。
當(dāng)然,目前的機(jī)器人仍處于非常笨拙的狀態(tài)——一般來說,你必須用代碼為它們說明一切:這是你向前滾動的方式,這是你移動手臂的方式。我們?nèi)祟愒趯W(xué)習(xí)方式上要聰明得多。甚至嬰兒也明白,一個(gè)從視野中消失的物體并沒有從物理世界中消失。他們知道可以滾動球,但無法滾動沙發(fā)。從沙發(fā)上摔下來沒關(guān)系,但從懸崖上摔下來卻不是。
所有這些實(shí)驗(yàn)都在你的大腦中建立了一個(gè)世界模型,這就是為什么你可以在學(xué)會駕駛汽車后,不會立馬撞車。Facebook首席人工智能科學(xué)家Yann LeCun說:“我們事先知道,如果開車靠近懸崖,然后向右轉(zhuǎn)動方向盤,汽車就會從懸崖上掉下來,不會有什么好事發(fā)生!蔽覀冾^腦中有一個(gè)自學(xué)的模型,可以防止我們做傻事。Facebook也試圖給機(jī)器提供這種模式。“在我看來,學(xué)習(xí)世界模型的系統(tǒng)是在人工智能領(lǐng)域真正取得重大進(jìn)展的下一個(gè)挑戰(zhàn),”LeCun補(bǔ)充道。
不過,F(xiàn)acebook的研究小組并不是第一個(gè)試圖讓機(jī)器人自學(xué)移動的團(tuán)隊(duì)。在加州大學(xué)伯克利分校,一組研究人員使用了一種叫做強(qiáng)化學(xué)習(xí)的技術(shù),來教一個(gè)名叫Brett的雙臂機(jī)器人把一個(gè)方釘塞進(jìn)一個(gè)方孔里。簡而言之,機(jī)器人嘗試了許許多多的隨機(jī)運(yùn)動。如果在一次移動中更接近目標(biāo),系統(tǒng)會給它一個(gè)數(shù)字“獎勵”。如果它搞砸了,它會被數(shù)字“記過”。經(jīng)過多次反復(fù),尋求獎勵的機(jī)器人會讓它的手越來越靠近那個(gè)方孔,最后把釘子放進(jìn)去。
讓機(jī)器人擁有“好奇心”
Facebook正在做的實(shí)驗(yàn)有點(diǎn)不同!拔覀兿胍獓L試的是灌輸這種好奇心的觀念,”Facebook人工智能研究科學(xué)家Franziska Meier說。人類就是這樣學(xué)會操縱物體的:孩子們被對世界的好奇心所驅(qū)使。他們嘗試新的東西,比如拽貓的尾巴,并不是因?yàn)樗麄儽仨氝@么做,而是他們想知道如果這樣做了會發(fā)生什么。
因此,盡管像Brett這樣的機(jī)器人會一點(diǎn)一點(diǎn)地完善自己的動作,但Facebook的機(jī)械臂卻可能會出現(xiàn)靠近目標(biāo)時(shí)偏離方向的現(xiàn)象。這是因?yàn)檠芯咳藛T沒有獎勵它增量成功,而是給予它嘗試非最佳動作的自由。它在嘗試新的東西,即使這些東西現(xiàn)在看起來并不特別理性。
每次移動都為系統(tǒng)提供數(shù)據(jù)。在每個(gè)關(guān)節(jié)上施加扭矩是為了把手臂移動到那個(gè)特定的位置。Meier說:“雖然沒有完成任務(wù),但它給了我們更多的數(shù)據(jù),我們通過這樣的探索獲得的數(shù)據(jù)種類比不探索時(shí)要多。”這個(gè)概念被稱為自我監(jiān)督學(xué)習(xí)——機(jī)器人嘗試新事物并更新軟件模型,這可以幫助它預(yù)測其行為的后果。
這個(gè)想法是為了讓機(jī)器更靈活,對一項(xiàng)任務(wù)不那么專一。我們可以把它想象成完成一個(gè)迷宮。也許機(jī)器人知道它需要朝哪個(gè)方向前進(jìn)才能找到出口。它可能會一次又一次地嘗試到達(dá)那里,即使它不可避免地會在那次追逐中陷入死胡同。奧斯陸大學(xué)機(jī)器人專家T?nnes Nygaard說:“由于你如此專注于向那個(gè)方向移動,你可能會走進(jìn)角落!彼呀(jīng)開發(fā)出一種四足機(jī)器人,可以自己學(xué)會走路。(Facebook也在嘗試讓一個(gè)六腿機(jī)器人自己行走,但是在我參觀實(shí)驗(yàn)室的時(shí)候該公司尚未能進(jìn)行展示。)“與其如此專注于說,我想朝著我知道解決方案所在的方向前進(jìn),不如我試著專注于探索。我將嘗試尋找新的解決方案。”
所以Facebook的機(jī)器人手臂做出的那些看似不連貫的動作實(shí)際上是一種好奇心,正是這種好奇心可以讓機(jī)器更容易適應(yīng)環(huán)境。想象一下一個(gè)家用機(jī)器人正試圖填裝洗碗機(jī)。也許它認(rèn)為把杯子放在頂部架子上最有效的方法是從側(cè)面拿過來,在這種情況下杯子會碰到架子的邊緣。從某種意義上說,這是確定性的:一次又一次的反復(fù)嘗試,讓它走上這條不太理想的道路,在這條道路上,它試圖更好地側(cè)向裝載,但現(xiàn)在它無法備份并嘗試新的東西。另一方面,一個(gè)充滿好奇心的機(jī)器人可以通過實(shí)驗(yàn)和學(xué)習(xí),了解到從上面進(jìn)來實(shí)際上是最好的方法。它是靈活的,不是決定性的,這在理論上允許它更容易適應(yīng)動態(tài)的人類環(huán)境。

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動更多
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
8月5日立即報(bào)名>> 【在線會議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
推薦專題