蘋果申請(qǐng)新專利 Siri可解讀用戶情緒
據(jù)蘋果14日提交的最新專利申請(qǐng)文件顯示,蘋果正在開發(fā)一種全新的方法,通過在未來版本的Siri或者其他系統(tǒng)中添加面部分析功能,來幫助Siri解讀用戶需求。這意味著Siri將來可能不僅懂得語音識(shí)別,在與用戶進(jìn)行對(duì)話時(shí),它甚至可以啟用設(shè)備的FaceTime攝像頭,來分析用戶面部表情,解讀用戶情緒。
蘋果官方稱,申請(qǐng)這一專利的目的是減少語音請(qǐng)求被Siri誤解的次數(shù),試圖通過分析用戶情緒來進(jìn)一步提高準(zhǔn)確度。蘋果還提到:“Smart Apps可以代表用戶執(zhí)行操作,以回應(yīng)用戶的自然語言需求,但在某些情況下,可能會(huì)與用戶想要的操作并不符合。但是現(xiàn)在我們可以對(duì)視頻輸入中的面部圖像進(jìn)行分析,通過識(shí)別形狀或運(yùn)動(dòng)來識(shí)別特定的肌肉或肌肉組織是否被激活”。
目前人工智能較為成熟的應(yīng)用之一就是圖像和語音識(shí)別。圖像識(shí)別是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。得益于數(shù)字化時(shí)代帶來的海量數(shù)據(jù),加之機(jī)器學(xué)習(xí)方法的廣泛應(yīng)用,計(jì)算機(jī)視覺發(fā)展迅速。以往許多基于規(guī)則的處理方式,都被機(jī)器學(xué)習(xí)所替代:機(jī)器自動(dòng)從海量數(shù)據(jù)中總結(jié)歸納物體的特征,然后進(jìn)行識(shí)別和判斷。其已經(jīng)廣泛應(yīng)用到拍照識(shí)物、畫面增強(qiáng)、人機(jī)交互等各種領(lǐng)域,包括典型的相機(jī)人臉檢測(cè)、安防人臉識(shí)別、車牌識(shí)別等等。
神經(jīng)網(wǎng)絡(luò)圖像識(shí)別的發(fā)展,各類視覺識(shí)別的任務(wù)精度都得到了大幅提升。在全球最權(quán)威的計(jì)算機(jī)視覺競賽ILSVR上,千類物體識(shí)別錯(cuò)誤率在2011年時(shí)還高達(dá)25.8%,從2012年引入深度學(xué)習(xí)之后,后續(xù)4年的錯(cuò)誤率分別達(dá)到了16.4%、11.7%、6.7%、3.7%,出現(xiàn)了顯著突破。現(xiàn)在,人臉識(shí)別甚至能做到誤判率低于百萬分之一。
語音技術(shù)主要包括語音合成和語音識(shí)別兩項(xiàng)關(guān)鍵技術(shù)。讓機(jī)器說話,用的是語音合成技術(shù);讓機(jī)器聽懂人說話,用的是語音識(shí)別技術(shù)。語音識(shí)別技術(shù)是指將人類語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列,與說話人識(shí)別及說話人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。此外,語音技術(shù)還包括語音編碼、音色轉(zhuǎn)換、口語評(píng)測(cè)、語音消噪和增強(qiáng)等技術(shù)。
科大訊飛作為智能語音識(shí)別領(lǐng)域的領(lǐng)跑者,在技術(shù)應(yīng)用中訊飛翻譯機(jī)3.0支持和7個(gè)領(lǐng)域的專業(yè)人士充分對(duì)話,覆蓋醫(yī)療、外貿(mào)、體育、金融、能源、計(jì)算機(jī)、法律等七大熱門行業(yè)的AI翻譯,同時(shí)支持粵語、四川話、東北話、河南話等中文方言與英語的互譯,普通話與維語、藏語的即時(shí)互譯。另外,即使是方言口音的英語,訊飛翻譯機(jī)3.0也能識(shí)別。
語音識(shí)別技術(shù)從客服到智能家居,再到移動(dòng)手機(jī)端和車載環(huán)境等多方面具有廣泛的應(yīng)用場(chǎng)景。但語音識(shí)別還是有一些缺點(diǎn)的。語音隨時(shí)間而變化,所以必須使用生物識(shí)別模板。語音也會(huì)由于嗓音沙啞、情緒壓力或是外界環(huán)境影響而變化。語音識(shí)別系統(tǒng)比指紋識(shí)別系統(tǒng)有著較高的誤識(shí)率,因?yàn)槿藗兊穆曇舨幌裰讣y那樣獨(dú)特和唯一。
目前圖像與語音識(shí)別技術(shù)其很大程度上還是處于識(shí)別和歸類的層面,想要透過表層的識(shí)別去進(jìn)行深層的情緒認(rèn)識(shí)和理解,進(jìn)而優(yōu)化人機(jī)交互的體驗(yàn),尚需時(shí)日。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺語言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國跨境支付十大趨勢(shì)
- 5 中國最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 7 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 張勇等人退出阿里合伙人
- 10 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市