人工智能時(shí)代來(lái)襲,輸入法如何決勝下一個(gè)10年
黑科技成就輸入法
無(wú)論是功能上的全能,還是體驗(yàn)上的全能,輸入法產(chǎn)品能夠?qū)崿F(xiàn)質(zhì)變,甚至能夠適應(yīng)一些極限和極端的輸入場(chǎng)景,除了產(chǎn)品本身的創(chuàng)新外,不斷的技術(shù)迭代是最核心的原因。用戶之所以能夠只花一半的時(shí)間完成整個(gè)輸入過(guò)程,都依賴于輸入法們背后的黑科技。
訊飛輸入法可以說(shuō)是“科技成就輸入法”的最佳代言人。一方面,其背靠有20多年智能語(yǔ)音技術(shù)沉淀的科大訊飛,已有20萬(wàn)小時(shí)訓(xùn)練數(shù)據(jù)積累;另一方面,科大訊飛有太多的國(guó)際賽事頂尖榮譽(yù),比如在2018年由國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì)(ACL)下屬組織主辦的第十二屆國(guó)際語(yǔ)義評(píng)測(cè)比賽(SemEval2018)中,科大訊飛斬獲了基于常識(shí)的機(jī)器閱讀理解全球第一;2018年的國(guó)際權(quán)威英文語(yǔ)音識(shí)別大賽“CHiME-6”中,科大訊飛包攬了兩項(xiàng)第一名;2019年在ICDAR2019舉辦的場(chǎng)景文本視覺(jué)問(wèn)答挑戰(zhàn)賽ST-VQA中,科大訊飛包攬了三項(xiàng)冠軍;2020年初在德國(guó)The 20BN-Jester Dataset手勢(shì)識(shí)別評(píng)測(cè)中,科大訊飛以97.26%的準(zhǔn)確率斬獲冠軍,且刷新了世界紀(jì)錄……訊飛輸入法背后的黑科技可以從四方面來(lái)看。
一、語(yǔ)音輸入
語(yǔ)音輸入講究快速和準(zhǔn)確,訊飛輸入法之所以能達(dá)到一分鐘400字、識(shí)別準(zhǔn)確率98%的水平,主要在于其自研的“記憶增強(qiáng)的多通道全端到端語(yǔ)音識(shí)別框架”,這項(xiàng)技術(shù)簡(jiǎn)單來(lái)說(shuō)就是能夠完全將前端語(yǔ)音處理過(guò)程深度學(xué)習(xí)化,并使用深度卷積神經(jīng)網(wǎng)絡(luò)和后端識(shí)別模型進(jìn)行混合訓(xùn)練,從而大大提高了語(yǔ)音識(shí)別的效率。
至于能夠使用23種方言進(jìn)行精準(zhǔn)語(yǔ)音輸入,一方面要靠通過(guò)多方言共享方式訓(xùn)練的Multi-lingual多語(yǔ)言建模技術(shù),另一方面要靠GlobalPhone全球音素集,這項(xiàng)技術(shù)從聲學(xué)層面的相似性來(lái)統(tǒng)一各方言的音素定義,使方言“語(yǔ)圖譜”模型進(jìn)一步精進(jìn),從而使得方言識(shí)別效果有效提升。多語(yǔ)種互譯功能則對(duì)技術(shù)提出了更大的挑戰(zhàn)性,以中英互譯為例,訊飛輸入法基于對(duì)抗樣本訓(xùn)練方法提出了融合副語(yǔ)言特征的“高魯棒性語(yǔ)音翻譯技術(shù)”,并在模型中結(jié)合特定技術(shù),有效提高了最終翻譯結(jié)果。
二、拼音輸入
在拼音輸入上,訊飛輸入法創(chuàng)新性引入了Encoder-Decoder框架,構(gòu)建了新一代拼音識(shí)別引擎,極大簡(jiǎn)化了傳統(tǒng)拼音識(shí)別模型,同時(shí)在Attention機(jī)制和長(zhǎng)短期記憶網(wǎng)絡(luò)的門(mén)控機(jī)制,以及Transformer等模塊的共同作用下,長(zhǎng)句輸入識(shí)別效果有效提升,能夠提前預(yù)測(cè)用戶想輸入的內(nèi)容,還能有效實(shí)現(xiàn)智能糾錯(cuò)。
此外,這一模型由于采用的是序列建模,建模不再依賴詞典,更易實(shí)現(xiàn)中英文混合建模,因而讓訊飛輸入法在中英混輸上實(shí)現(xiàn)了非常出色混輸表現(xiàn)。值得注意的是,不論是智能預(yù)測(cè),還是智能糾錯(cuò),背后都有可實(shí)時(shí)更新的百萬(wàn)詞庫(kù)。
三、手寫(xiě)輸入
同樣是手寫(xiě),體驗(yàn)卻完全不一樣,這是因?yàn)橛嶏w輸入法的手寫(xiě)識(shí)別可支持兩萬(wàn)多類(lèi)中文字符、52類(lèi)英文字符、10類(lèi)阿拉伯?dāng)?shù)字以及100多種特殊符號(hào),這種超級(jí)識(shí)別能力的背后,是訊飛輸入法的“HWR手寫(xiě)識(shí)別技術(shù)”,這項(xiàng)技術(shù)采用的是CNN卷積神經(jīng)網(wǎng)絡(luò)技術(shù),可支持實(shí)時(shí)手寫(xiě)軌跡,邊寫(xiě)邊出字,而且單個(gè)字符識(shí)別僅需15ms,響應(yīng)迅速無(wú)延遲。
四、掃描輸入
掃描輸入的技術(shù)支撐是計(jì)算機(jī)視覺(jué),面對(duì)復(fù)雜的手寫(xiě)文字、中英混合文字,“OCR文字檢測(cè)技術(shù)”可檢測(cè)任意方向和形狀的文字,“OCR文字識(shí)別技術(shù)”則可以有效緩解因環(huán)境問(wèn)題造成的識(shí)別效果低下問(wèn)題。
綜上,基于AI和大數(shù)據(jù)的組合技術(shù),如今的輸入法不再死板堅(jiān)硬,即使面對(duì)輸入場(chǎng)景的復(fù)雜需求,也能夠在不同語(yǔ)種、不同語(yǔ)境、不同語(yǔ)調(diào)下滿足不同用戶的需求。過(guò)去的輸入法只能輔助,而現(xiàn)在,科技加持下的輸入法,更像是一個(gè)“一站式”的輸入管家。
輸入法的智能普惠
黑科技成就了輸入法,也成就了輸入法的地位。根據(jù)相關(guān)報(bào)告提供的數(shù)據(jù),以三大輸入法為代表的第三方輸入法,已經(jīng)覆蓋了超過(guò)90%的中國(guó)網(wǎng)民。
要是放大到整個(gè)輸入法行業(yè),可以說(shuō)人人都是輸入法的受益者,移動(dòng)設(shè)備也好,個(gè)人電腦也好,日常交流必然離不開(kāi)輸入法的幫助?梢哉f(shuō),輸入法已經(jīng)成為一個(gè)互聯(lián)網(wǎng)溝通的基礎(chǔ)設(shè)施。而且值得慶幸的是,訊飛輸入法等頭部產(chǎn)品在技術(shù)上的進(jìn)化,讓這個(gè)基礎(chǔ)設(shè)施不斷產(chǎn)生質(zhì)變,越來(lái)越智能。
應(yīng)該說(shuō),像訊飛輸入法這樣始終癡迷于“科技驅(qū)動(dòng)”的輸入法產(chǎn)品,是輸入法作為工具產(chǎn)品在價(jià)值上得到躍進(jìn)式提升的關(guān)鍵,因?yàn)樗鼈冇眉夹g(shù)無(wú)限拔高了輸入法產(chǎn)品的價(jià)值上限。換言之,訊飛輸入法們的“科技大法”一定程度上改善了整個(gè)互聯(lián)網(wǎng)世界的溝通協(xié)作效率。
技術(shù)無(wú)上限,輸入法產(chǎn)品也無(wú)上限。對(duì)9.04億中國(guó)互聯(lián)網(wǎng)網(wǎng)民而言,黑科技持續(xù)加持下的輸入法工具,會(huì)繼續(xù)為每個(gè)用戶提供獨(dú)一無(wú)二的使用體驗(yàn),真正實(shí)現(xiàn)全方位的智能普惠。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專(zhuān)題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹(shù)機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線
- 8 谷歌吹響AI沖鋒號(hào),AI還有哪些機(jī)會(huì)
- 9 蘋(píng)果把身家押在Siri上:一場(chǎng)輸不起的自我革命
- 10 騰訊米哈游押寶的中國(guó)AI應(yīng)用,正在海外悶聲發(fā)財(cái)