蘋(píng)果申請(qǐng)新專(zhuān)利 Siri可解讀用戶(hù)情緒
據(jù)蘋(píng)果14日提交的最新專(zhuān)利申請(qǐng)文件顯示,蘋(píng)果正在開(kāi)發(fā)一種全新的方法,通過(guò)在未來(lái)版本的Siri或者其他系統(tǒng)中添加面部分析功能,來(lái)幫助Siri解讀用戶(hù)需求。這意味著Siri將來(lái)可能不僅懂得語(yǔ)音識(shí)別,在與用戶(hù)進(jìn)行對(duì)話(huà)時(shí),它甚至可以啟用設(shè)備的FaceTime攝像頭,來(lái)分析用戶(hù)面部表情,解讀用戶(hù)情緒。
蘋(píng)果官方稱(chēng),申請(qǐng)這一專(zhuān)利的目的是減少語(yǔ)音請(qǐng)求被Siri誤解的次數(shù),試圖通過(guò)分析用戶(hù)情緒來(lái)進(jìn)一步提高準(zhǔn)確度。蘋(píng)果還提到:“Smart Apps可以代表用戶(hù)執(zhí)行操作,以回應(yīng)用戶(hù)的自然語(yǔ)言需求,但在某些情況下,可能會(huì)與用戶(hù)想要的操作并不符合。但是現(xiàn)在我們可以對(duì)視頻輸入中的面部圖像進(jìn)行分析,通過(guò)識(shí)別形狀或運(yùn)動(dòng)來(lái)識(shí)別特定的肌肉或肌肉組織是否被激活”。
目前人工智能較為成熟的應(yīng)用之一就是圖像和語(yǔ)音識(shí)別。圖像識(shí)別是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。得益于數(shù)字化時(shí)代帶來(lái)的海量數(shù)據(jù),加之機(jī)器學(xué)習(xí)方法的廣泛應(yīng)用,計(jì)算機(jī)視覺(jué)發(fā)展迅速。以往許多基于規(guī)則的處理方式,都被機(jī)器學(xué)習(xí)所替代:機(jī)器自動(dòng)從海量數(shù)據(jù)中總結(jié)歸納物體的特征,然后進(jìn)行識(shí)別和判斷。其已經(jīng)廣泛應(yīng)用到拍照識(shí)物、畫(huà)面增強(qiáng)、人機(jī)交互等各種領(lǐng)域,包括典型的相機(jī)人臉檢測(cè)、安防人臉識(shí)別、車(chē)牌識(shí)別等等。
神經(jīng)網(wǎng)絡(luò)圖像識(shí)別的發(fā)展,各類(lèi)視覺(jué)識(shí)別的任務(wù)精度都得到了大幅提升。在全球最權(quán)威的計(jì)算機(jī)視覺(jué)競(jìng)賽ILSVR上,千類(lèi)物體識(shí)別錯(cuò)誤率在2011年時(shí)還高達(dá)25.8%,從2012年引入深度學(xué)習(xí)之后,后續(xù)4年的錯(cuò)誤率分別達(dá)到了16.4%、11.7%、6.7%、3.7%,出現(xiàn)了顯著突破,F(xiàn)在,人臉識(shí)別甚至能做到誤判率低于百萬(wàn)分之一。
語(yǔ)音技術(shù)主要包括語(yǔ)音合成和語(yǔ)音識(shí)別兩項(xiàng)關(guān)鍵技術(shù)。讓機(jī)器說(shuō)話(huà),用的是語(yǔ)音合成技術(shù);讓機(jī)器聽(tīng)懂人說(shuō)話(huà),用的是語(yǔ)音識(shí)別技術(shù)。語(yǔ)音識(shí)別技術(shù)是指將人類(lèi)語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列,與說(shuō)話(huà)人識(shí)別及說(shuō)話(huà)人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語(yǔ)音的說(shuō)話(huà)人而非其中所包含的詞匯內(nèi)容。此外,語(yǔ)音技術(shù)還包括語(yǔ)音編碼、音色轉(zhuǎn)換、口語(yǔ)評(píng)測(cè)、語(yǔ)音消噪和增強(qiáng)等技術(shù)。
科大訊飛作為智能語(yǔ)音識(shí)別領(lǐng)域的領(lǐng)跑者,在技術(shù)應(yīng)用中訊飛翻譯機(jī)3.0支持和7個(gè)領(lǐng)域的專(zhuān)業(yè)人士充分對(duì)話(huà),覆蓋醫(yī)療、外貿(mào)、體育、金融、能源、計(jì)算機(jī)、法律等七大熱門(mén)行業(yè)的AI翻譯,同時(shí)支持粵語(yǔ)、四川話(huà)、東北話(huà)、河南話(huà)等中文方言與英語(yǔ)的互譯,普通話(huà)與維語(yǔ)、藏語(yǔ)的即時(shí)互譯。另外,即使是方言口音的英語(yǔ),訊飛翻譯機(jī)3.0也能識(shí)別。
語(yǔ)音識(shí)別技術(shù)從客服到智能家居,再到移動(dòng)手機(jī)端和車(chē)載環(huán)境等多方面具有廣泛的應(yīng)用場(chǎng)景。但語(yǔ)音識(shí)別還是有一些缺點(diǎn)的。語(yǔ)音隨時(shí)間而變化,所以必須使用生物識(shí)別模板。語(yǔ)音也會(huì)由于嗓音沙啞、情緒壓力或是外界環(huán)境影響而變化。語(yǔ)音識(shí)別系統(tǒng)比指紋識(shí)別系統(tǒng)有著較高的誤識(shí)率,因?yàn)槿藗兊穆曇舨幌裰讣y那樣獨(dú)特和唯一。
目前圖像與語(yǔ)音識(shí)別技術(shù)其很大程度上還是處于識(shí)別和歸類(lèi)的層面,想要透過(guò)表層的識(shí)別去進(jìn)行深層的情緒認(rèn)識(shí)和理解,進(jìn)而優(yōu)化人機(jī)交互的體驗(yàn),尚需時(shí)日。

發(fā)表評(píng)論
登錄
手機(jī)
驗(yàn)證碼
立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)
還不是會(huì)員?免費(fèi)注冊(cè)
忘記密碼請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
12月18日立即報(bào)名>> 【線(xiàn)下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
推薦專(zhuān)題
- 1 人形機(jī)器人,正狂奔在批量交付的曠野
- 2 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 3 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 4 5 2025年8月人工智能投融資觀(guān)察
- 6 一家被嚴(yán)重低估的國(guó)產(chǎn)AI巨頭
- 7 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 8 Manus跑路,大廠(chǎng)掉線(xiàn),只能靠DeepSeek了
- 9 地平線(xiàn)的野心:1000萬(wàn)套HSD上車(chē)
- 10 AI走進(jìn)育種溫室,"吉兒"究竟改變了什么?