特斯拉AI準(zhǔn)備打敗波士頓動(dòng)力?
作者
王小西
特斯拉的AI魔幻大法,“看上去很美”。
責(zé)編丨查攸吟
編輯丨任哲
看完特斯拉的AI DAY發(fā)布會(huì),忽然反應(yīng)過(guò)來(lái),這這這,不是個(gè)大型招聘會(huì)么!
之前業(yè)內(nèi)猜測(cè)的AI神經(jīng)網(wǎng)絡(luò)、FSD、自研超算Dojo,以及突如其來(lái)的人形機(jī)器人……果然放了不少“大招”。這些用來(lái)烘托下半場(chǎng)馬斯克支支吾吾、有點(diǎn)不好意思的推介,“歡迎大家來(lái)特斯拉工作”的“司馬昭之心”很明顯啊!
要知道,2021年才半年,特斯拉就失去了4位直接向馬斯克匯報(bào)的資深高管。最近的一位,是負(fù)責(zé)卡車業(yè)務(wù)的CEO杰羅姆·吉倫(Jerome Guillen)。而且,吉倫是目前馬斯克最重要的副手,也是特斯拉最頂級(jí)的四大高管之一,3月才被任命。所以,特斯拉有多缺人,我們可以理解了。
不過(guò),讓記者感到好奇的是,在最后的回答提問(wèn)環(huán)節(jié),馬斯克的眼神是有點(diǎn)飄忽的,有點(diǎn)心神不寧的樣子?磥(lái),被美國(guó)國(guó)家公路交通安全管理局(NHTSA)調(diào)查還是有很大影響。
就在前幾天,業(yè)內(nèi)還對(duì)特斯拉的“純視覺(jué)”路線熱烈討論,再加上被調(diào)查,特斯拉的AI DAY應(yīng)時(shí)而至,卻也有難以言說(shuō)的尷尬。而且,有意思的是,因?yàn)榧夹g(shù)故障,發(fā)布會(huì)整整推遲了40分鐘,馬斯克一上來(lái)就不得不道歉。
當(dāng)然,AI DAY算是特斯拉今年最重大的事件,也是繼2019年4月23日的Autonomous Day、2020年9月23日的Battery Day之后,第三個(gè)以“Day”命名的技術(shù)發(fā)布會(huì)。說(shuō)起來(lái),技術(shù)含量也是最高的。
我們來(lái)看看這次的AI DAY發(fā)布了哪些新“黑科技”。
01
自動(dòng)駕駛和“純視覺(jué)”
發(fā)布會(huì)一開(kāi)始,就是一段FSD(Fully Self Driving,全自動(dòng)輔助駕駛系統(tǒng))的VCR短視頻,展示了V9.0最新的開(kāi)放道路自動(dòng)駕駛情形。不過(guò),我們可以看到,全程駕駛員的手都是托著方向盤(pán),保持著隨時(shí)觸碰的狀態(tài)。
這也說(shuō)明,特斯拉在發(fā)布FSD BETA V9.0之后,不敢玩得太嗨了。就像記者在《特斯拉純視覺(jué)路線,能不能走通?|C次元》對(duì)其“純視覺(jué)”路線做的質(zhì)疑,這種夸大傳播的惡果就是,最后引起全面的質(zhì)疑和被調(diào)查。而在8月16日,特斯拉又推送了FSD Beta V9.2版本。
回過(guò)來(lái)看發(fā)布會(huì),AI總監(jiān)恩喬·卡帕西Andrej Karpathy博士首先上臺(tái),討論了特斯拉AI 的多攝像頭的自動(dòng)駕駛系統(tǒng)。它通過(guò)八個(gè)攝像頭的數(shù)據(jù)輸入(1280×960 12-Bit HDR 36Hz)進(jìn)單個(gè)神經(jīng)網(wǎng)絡(luò)中,整合成 3D 環(huán)境的感知,這被稱為Vector Space(矢量空間)。
Karpath指出,AI可以被視為一種生物,可以從頭開(kāi)始構(gòu)建,包括其合成視覺(jué)皮層。當(dāng)特斯拉在其汽車中設(shè)計(jì)視覺(jué)皮層時(shí),將其建模為“眼睛如何感知生物視覺(jué)”。他還回溯了特斯拉的視覺(jué)處理策略多年來(lái)是如何演變的,以及特斯拉具備多任務(wù)學(xué)習(xí)能力的“HydraNets”(神盾局的“九頭蛇網(wǎng)絡(luò)”都出來(lái)了?)。
特斯拉的自動(dòng)駕駛算法是從識(shí)別單張圖片的普通視覺(jué)算法開(kāi)始,雖然單個(gè)攝像頭的單獨(dú)檢測(cè)效果很棒,但這顯然不夠,F(xiàn)在的純視覺(jué)算法“HydraNets”基于不同攝像頭的視覺(jué)內(nèi)容進(jìn)行識(shí)別,而且訓(xùn)練和推斷是端到端的。
在展示了一段關(guān)于特斯拉過(guò)去如何處理其圖像數(shù)據(jù),以及共享的FSD流行視頻后,Karpathy指出,事實(shí)證明過(guò)去FSD的系統(tǒng)不夠完善,這是特斯拉在推出Smart Summon時(shí)學(xué)到的東西。
Karpathy闡述了特斯拉如何從頭開(kāi)始重新設(shè)計(jì)他們的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),并利用多攝像頭路線,“每輛車上的八個(gè)攝像頭都被輸入到一個(gè)3維‘矢量空間’中!逼渲邪ㄏ鄼C(jī)的校準(zhǔn)、緩存、隊(duì)列和優(yōu)化以簡(jiǎn)化所有任務(wù)。這也是迄今為止最簡(jiǎn)化的迭代方式。
Karpathy還不忘Diss了一下Super Cruise和Waymo,“今天,特斯拉的FSD戰(zhàn)略更具凝聚力,車輛可以在行駛時(shí)有效地實(shí)時(shí)繪制地圖,”他說(shuō)與這些競(jìng)爭(zhēng)對(duì)手采用的預(yù)先繪制地圖的策略相比,是一個(gè)巨大的差異。
但是,就像記者在文章中批判的,沒(méi)有激光雷達(dá)的加入,就像瘸了一條腿的人,特斯拉在“純視覺(jué)”路線上是走不遠(yuǎn)的。雖然在馬斯克看來(lái),特斯拉的深度學(xué)習(xí)系統(tǒng)已經(jīng)比毫米波雷達(dá)強(qiáng)100倍,現(xiàn)在的毫米波雷達(dá)已經(jīng)開(kāi)始拖后腿。
就像一位業(yè)內(nèi)專家所說(shuō),“不用毫米波雷達(dá),那也別用超聲波雷達(dá)啊?!!!純視覺(jué),暴雨怎么辦?大霧怎么辦?”我們知道,特斯拉依靠的最先進(jìn)的機(jī)器學(xué)習(xí)只是識(shí)別模式,這意味著它會(huì)在新情況下掙扎。一掙扎,就會(huì)產(chǎn)生誤判。
與人類司機(jī)不同的是,如果系統(tǒng)沒(méi)有遇到場(chǎng)景,它就無(wú)法推理該做什么!叭魏蜛I系統(tǒng)都不了解實(shí)際發(fā)生的事情,”這是研究自動(dòng)駕駛汽車計(jì)算機(jī)視覺(jué)的康奈爾大學(xué)副教授克里安·溫伯格(Kilian Weinberger)下的斷言。
02
混合規(guī)劃系統(tǒng)
我們?cè)賮?lái)看看,自動(dòng)駕駛軟件總監(jiān)Ashok Elluswamy介紹的混合規(guī)劃系統(tǒng)。他通過(guò)展示 Autopilot如何執(zhí)行車道變換來(lái)證明這套解決方案的先進(jìn)。
具體來(lái)說(shuō),當(dāng)特斯拉的車與其他汽車并排行駛時(shí),Autopilot 不僅要考慮它們的駕駛方式,還必須考慮其他汽車的運(yùn)行方式。他展示了一段特斯拉的車在道路上行駛并與多輛車打交道的視頻,來(lái)證明這一點(diǎn)。
而這時(shí)候,Karpathy回來(lái)討論數(shù)據(jù)標(biāo)注的問(wèn)題。他指出,外包給第三方公司的手動(dòng)標(biāo)簽并不是最佳選擇。因此,特斯拉選擇建立自己的標(biāo)簽團(tuán)隊(duì)。Karpathy指出,最初特斯拉使用的是 2D 圖像標(biāo)記。最終,特斯拉過(guò)渡到4D標(biāo)簽,也就是可以在“矢量空間”中進(jìn)行標(biāo)簽。
▲特斯拉全自動(dòng)駕駛最終架構(gòu)
但這還不夠,因此特斯拉開(kāi)發(fā)了自動(dòng)標(biāo)簽。Ashok表示,因?yàn)橛刑嗟臉?biāo)簽需要完成,手動(dòng)完成是不可能的。他展示了“重建”的過(guò)程:道路和道路上的其他物品如何從一輛正在行駛的汽車中“重建”出來(lái)。
這讓特斯拉能夠有效、更快地標(biāo)記數(shù)據(jù),同時(shí),車輛即使在存在遮擋的情況下也能安全準(zhǔn)確地導(dǎo)航。Ashok表示,這些策略最終幫助特斯拉從其FSD和Autopilot套件中淘汰了雷達(dá),并采用了純視覺(jué)模型。雷達(dá)+攝像頭系統(tǒng)與純視覺(jué)之間的比較,顯示了公司當(dāng)前的戰(zhàn)略有多精細(xì)。
這位高管還談到了“仿真”是如何幫助特斯拉開(kāi)發(fā)其自動(dòng)駕駛系統(tǒng)的。例如,它幫助公司識(shí)別行人、自行車和車輛檢測(cè)和運(yùn)動(dòng)學(xué)。他指出,當(dāng)數(shù)據(jù)難以獲取、難以標(biāo)記或處于閉環(huán)狀態(tài)時(shí),“仿真”會(huì)有所幫助。這些,都基于3.71 億張模擬圖像和4.8億個(gè)長(zhǎng)方體“標(biāo)簽”。
Ashok說(shuō),“仿真”已經(jīng)對(duì)特斯拉產(chǎn)生很大幫助?吹竭@里,我只能說(shuō),對(duì)于越走越偏的特斯拉來(lái)說(shuō),真的是“謎之自信”。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市
- 7 特斯拉Robotaxi上路,馬斯克端上畫(huà)了十年的餅
- 8 “AI六小虎”到了下一個(gè)賽點(diǎn)
- 9 張勇等人退出阿里合伙人
- 10 AI視頻,攪動(dòng)1.5萬(wàn)億市場(chǎng)