AI時(shí)代工具應(yīng)用如何轉(zhuǎn)型,或許百度輸入法AI探索版給出了答案
1、最直接的影響是,智能語音更準(zhǔn)了,還能離線語音輸入。
未來用戶不管是在輸入法、搜索引擎說出自己的語音,都會(huì)更準(zhǔn)確,甚至可以中英文方言混輸。即使處于地鐵、電梯、隧道或人流密集等離線場(chǎng)景中,依然可以借助百度輸入法進(jìn)行精準(zhǔn)的語音輸入。
過去用戶往往是語音輸錯(cuò)一個(gè)字就會(huì)花10秒鐘來修改,而且由于方言、口語、中英文混雜的語言習(xí)慣,語音輸入法是沒辦法適應(yīng)這樣相對(duì)復(fù)雜的熟人環(huán)境的。這種經(jīng)歷讓用戶很難建立長(zhǎng)時(shí)間使用語音輸入法的習(xí)慣。所以雖然各家輸入法都說自己有97%以上的準(zhǔn)確率,但實(shí)際情況是,愿意使用語音輸入法的人寥寥無幾。
不過,無論是中英文夾雜,還是普通話家鄉(xiāng)話來回切換,百度輸入法都能準(zhǔn)確識(shí)別,是目前唯一實(shí)現(xiàn)了高精度中英文混合語音輸入、方言免切換語音輸入的輸入法產(chǎn)品。直接影響就是,用戶更愿意用語音輸入法了,用戶習(xí)慣會(huì)在技術(shù)提高的過程中一點(diǎn)一點(diǎn)普及。
2、AI能真正理解你的語音指令的含義。
所以你可以在輸入法中調(diào)用指令,發(fā)表情斗圖、發(fā)祝福語、發(fā)彈幕、發(fā)文件、OCR等等。滿足與輸入相關(guān)的周邊需求,實(shí)現(xiàn)全語音交互。
百度高級(jí)副總裁王海峰甚至認(rèn)為,輸入法本質(zhì)上是一款人機(jī)交互的工具,AI時(shí)代正在到來,人機(jī)交互的形態(tài)也將隨之革新。未來,百度輸入法將不僅基于手機(jī)端,還將致力于連通包括智能家居、車聯(lián)網(wǎng)等多種終端場(chǎng)景,集多種輸入方式為一體,幫助用戶在各種場(chǎng)景下高效、自如地傳遞信息。
3、在一些特殊場(chǎng)景實(shí)現(xiàn)更復(fù)雜的、具有邏輯層級(jí)的任務(wù)。
語音輸入法過去的使用場(chǎng)景是相對(duì)狹窄的,在一些邏輯復(fù)雜、場(chǎng)景復(fù)雜的環(huán)境中,往往很難勝任。
2017年年末,我在和一些智能音箱交互工程師探討的時(shí)候,他們提到語音交互因?yàn)槿狈ζ聊伙@示,層級(jí)邏輯很難展開,點(diǎn)外賣不太現(xiàn)實(shí)。但當(dāng)語音理解力更強(qiáng)甚至能和人類對(duì)話的時(shí)候,層級(jí)邏輯自然可以展開,點(diǎn)外賣甚至更復(fù)雜的操作都能實(shí)現(xiàn)。
當(dāng)語音調(diào)用的信息本身是具備可視性、劃分層級(jí)而且直觀易懂甚至縮短大量信息環(huán)節(jié)的時(shí)候。它本質(zhì)上就是一個(gè)更為合理的交互方式。
“流式多級(jí)的截?cái)郃ttention模型”未來如果能夠進(jìn)一步提高對(duì)語音的理解能力,輸入法或許能像人一樣聰明。未來的語音不會(huì)像Siri一樣愚蠢,只能被人們調(diào)戲,隨便幾句話就會(huì)陷入邏輯矛盾,就是因?yàn)樵贫丝梢岳斫獾恼Z音的顆粒度足夠細(xì),速度也足夠快。
在未來,智能語音甚至可以理解人們每一句話、每一個(gè)情緒的意義,讓兩人產(chǎn)生真正意義上的“靈魂對(duì)話”。
三、工具的轉(zhuǎn)型
整個(gè)行業(yè)都正在從移動(dòng)時(shí)代向AI時(shí)代過渡,移動(dòng)時(shí)代產(chǎn)品未來破局真的全靠AI。
甚至已經(jīng)有人提到,AI時(shí)代的人機(jī)交互應(yīng)該忘掉機(jī)器,因?yàn)槿f物皆界面。是的,AI賦能下的人機(jī)交互,將極大弱化人機(jī)交互中機(jī)器的概念。
你所接觸的一切物體都可能是一個(gè)隱藏的交互界面,你的動(dòng)作狀態(tài)、情緒以及環(huán)境中發(fā)生的事件,以伴隨的各種變化屬性為橋梁,時(shí)時(shí)刻刻都在被分析被推理,最終的結(jié)果將反映到真實(shí)的物理環(huán)境中,從而更自然地輔助你的日常生活。
在這一過程中,我們之前無比依賴的手機(jī)和電腦,可能已經(jīng)退居二線,成為真正的計(jì)算工具,不再和我們直接互動(dòng)了。
企業(yè)從移動(dòng)向AI時(shí)代轉(zhuǎn)型過程中,在產(chǎn)品層面要想的問題大約就是三點(diǎn):
1、如何把AI融入到移動(dòng)時(shí)代的產(chǎn)品之中,和現(xiàn)有功能產(chǎn)生更自然的嵌入;
2、如何形成AI時(shí)代的人機(jī)交互,讓移動(dòng)時(shí)代的產(chǎn)品在AI交互中形成合理的架構(gòu);
3、如何把移動(dòng)時(shí)代的產(chǎn)品放置在AI的技術(shù)生態(tài)中,繼續(xù)發(fā)揮作用;
我們甚至可以大膽預(yù)測(cè),未來所有的工具型產(chǎn)品,都離不開智能語音輸入法,因?yàn)橐哉Z音為核心的輸入法,就是重構(gòu)人機(jī)交互的最有效手段。因此百度高級(jí)副總裁王海峰提到:
作為百度AI能力應(yīng)用落地的重要產(chǎn)品之一,百度輸入法正在通過創(chuàng)新拓展大家的想象力邊界。這款A(yù)I輸入法,不僅是一款滿足用戶當(dāng)下需求的產(chǎn)品,也是為正在到來的AI時(shí)代所準(zhǔn)備的。百度輸入法將扮演好溝通橋梁的重要角色,讓人機(jī)交互進(jìn)入一個(gè)全新的階段。
語音交互方式,甚至比鍵鼠、觸摸屏有更大的信息量。劉慈欣在《鄉(xiāng)村教師》的這段話很形象地點(diǎn)名了未來語音交互的信息量:
你是想告訴我們,一種沒有記憶遺傳,相互間用聲波進(jìn)行信息交流,并且是以令人難以置信的每秒1至10比特的速率進(jìn)行交流的物種,能創(chuàng)造出5B級(jí)文明?!而且這種文明是在沒有任何外部高級(jí)文明培植的情況下自行進(jìn)化的?!
我們甚至可以這樣預(yù)測(cè),走過了鍵盤、鼠標(biāo)、觸摸屏等一系列交互手段,在這100年的彎路之后,智能語音為代表的對(duì)話式人工智能將讓人類返璞歸真。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺語言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市
- 7 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 8 “AI六小虎”到了下一個(gè)賽點(diǎn)
- 9 張勇等人退出阿里合伙人
- 10 AI視頻,攪動(dòng)1.5萬億市場(chǎng)