谷歌推出反應速度更快的語音助手,或將打敗SIRI和ALEXA
人們經常向Siri和Alexa這樣的語音助手打招呼,讓語音助手來服務自己,但是語音助手可能會反應很慢,而且這種體驗可能也會時不時地出現(xiàn)故障。
周二,谷歌展示了一項新技術,該技術能顯著提高語音識別的響應能力,這表明語音識別可能很快就會讓人無法抗拒。
在山景城的年度開發(fā)者大會上,谷歌吹噓其語音識別軟件縮小到其先前尺寸的1/25。首席執(zhí)行官Sundar Pichai稱這是一個里程碑,因為它意味著云服務器中的軟件可以安裝在Pixel智能手機中,使系統(tǒng)能夠更快地響應一個人的聲音。
在星期二的一系列演示中,谷歌展示的手機可以在發(fā)出聲音時識別文字,而不是將音頻發(fā)送到遠程服務器。更快的響應速度可能會改變人們與手機的關系。在所示的一個場景中,谷歌的虛擬助手比Siri等競爭對手顯得更加強大。
在該演示中,谷歌員工梅吉·霍林格(Meggie Hollinger)展示了她如何能夠通過一系列語音命令輕松地在手機上完成工作。而且每一項都比Siri更快地完成。
為了向朋友發(fā)送最近一次假期的照片,霍林格只說了兩句話,三個短語:“給我看黃石公園照片,有關動物的,把它發(fā)給賈斯汀!睅酌腌娭畠,谷歌的照片應用程序搜索了她的收藏夾,并且顯示出一只野牛的照片。
谷歌人工智能首席執(zhí)行官杰夫迪恩在推特上表示這個語音識別功能會改變你與手機互動的方式。
現(xiàn)代語音助手是2012年人工智能研究的產物,這表明深度學習技術可以使語音識別更加準確。谷歌表示,該技術將錯誤率降低了25%。但是,向云端發(fā)送音頻會限制速度,并由于網絡錯誤而產生故障。
谷歌花了數年時間研究如何縮小深度學習軟件,并在2019年將其語音識別模型降至一個很低的門檻。
該公司周二表示,最新版本的谷歌云端服務器語音識別軟件包的大小約為2千兆字節(jié),而且可以在智能手機上運行。
語音識別明顯比第一代基于云的深度學習技術快得多,可能會促使用戶更頻繁地使用語音命令并查詢。它還可能使谷歌的設備和服務比蘋果和亞馬遜等競爭對手更加強大。
Gartner的研究主管Werner Goertz稱,轉向語音設備識別可能會改變游戲規(guī)則。這可能是蘋果和亞馬遜更傳統(tǒng)語音系統(tǒng)面臨的重大挑戰(zhàn)。
谷歌還利用其技術為其未來的手機Live Caption創(chuàng)建了一項新功能。激活后,屏幕上會顯示手機上播放的任何語音的字幕,例如來自朋友的視頻或播客。由于是在手機上進行的,因此即使在飛行模式下也能正常工作。

請輸入評論內容...
請輸入評論/評論長度6~500個字