從語音識別到語義識別,中間還有多長的路要走?
最近科技圈刮起一股收購風,前面博通收購高通還在如火如荼的進行,這周蘋果就宣布收購音樂識別軟件Shazam。Shazam這個軟件,通過手機麥克風收錄音頻片段,能夠識別音樂、電影、電視節(jié)目甚至是廣告。那么蘋果公司整合這項技術(shù)做什么?很大可能是為了其人工智能助理軟件Siri。
Siri使用自然語言處理技術(shù),是AI技術(shù)的一大體系,而隨著近年定義和產(chǎn)業(yè)分工越發(fā)精細,語言識別漸漸分成了語音識別和語義識別兩個支系。語音和語義雖只有一字之差,卻有很大的不同。
打個簡單的比方,語音識別相當于是人的耳朵,而語義識別則是大腦,語音識別幫助機器獲取和輸出信息,那么語義識別則是對這些信息進行識別加工。
在這里,小編舉個例子來幫助大家更好的理解上面的話:
爸爸沒法舉起他的兒子,因為他很重。
問:誰重?
爸爸沒法舉起他的兒子,因為他很虛弱。
問:誰虛弱?
可以看到,這兩個句子結(jié)構(gòu)完全一致,后面的“他”指的到底是爸爸還是爸爸的兒子?這對于我們來說輕而易舉,因為我們有能清楚的通過我們積累的知識知道:爸爸舉不起兒子,要么兒子太重,爸爸舉不起;要么兒子不重,但是爸爸力氣小,比較虛弱,因此舉不起兒子。
但是對于一個只會語音識別的機器來說,它不會去思考句子中的“他”到底指的兒子還是爸爸,事實上,它也“想不清楚”。但是通過語義識別,機器會對聽到的信息進行加工理解,從而給出正確的答案。
與語音識別相比,顯然語義識別顯然要更深一個層次,用到的技術(shù)也更為復雜。
本文中,小編就給大家介紹一下人工智能中,自然語言識別這一重要支系。
語音識別發(fā)展史
語音是最自然的交流方式,自從1877年愛迪生發(fā)明了留聲機,人們就開始了與機器的交談,但是主要還是與人交流,而非機器本身。
1950年,計算機科學之父阿蘭·圖靈在《Mind》雜志上發(fā)表了題為《計算的機器和智能》的論文,首次提出了機器智能的概念,論文還提出了一種驗證機器是否有智能的方法:讓人和機器進行交流,如果人無法判斷自己交流的對象是人還是機器,就說明這個機器有智能了,這就是后來鼎鼎有名的人工智能圖靈測試。
到20世紀80年代,語音識別技術(shù)能夠?qū)⒖谡Z轉(zhuǎn)化為文本。
2001年,計算機語音識別達到了80%的準確度。從那時起,我們就可以提取口語語言的含義并作出回應。然而,多數(shù)情況下,語音技術(shù)仍然不能像鍵盤輸入那樣帶給我們足夠好的交流體驗。
近幾年來,語音識別又取得了巨大的技術(shù)進步?拼笥嶏w董事長劉慶峰在一次演講中,在演講的同時使用著最新的智能語音識別技術(shù)——可以讓他演講的內(nèi)容實時以中英文雙字幕的形式呈現(xiàn)在大屏幕上,反應迅速、幾乎沒錯。識別精確度超過95%。隨著這項技術(shù)的進步,語音優(yōu)先的基礎(chǔ)設(shè)施變得越來越重要,亞馬遜、蘋果、谷歌、微軟和百度都迅速部署了聲音優(yōu)先軟件、軟件構(gòu)建快和平臺。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
即日-9.16點擊進入 >> 【限時福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 3 宇樹機器人撞人事件的深度剖析:六維力傳感器如何成為人機安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨角獸:給機器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實用主義
- 7 騰訊 Q2 財報亮眼:AI 已成第二增長曲線
- 8 谷歌吹響AI沖鋒號,AI還有哪些機會
- 9 蘋果把身家押在Siri上:一場輸不起的自我革命
- 10 共探合作新機遇!江門市新會區(qū)(深圳)“AI + 機器人” 產(chǎn)業(yè)對接會成功舉辦