從語音識別到語義識別,中間還有多長的路要走?
最近科技圈刮起一股收購風(fēng),前面博通收購高通還在如火如荼的進行,這周蘋果就宣布收購音樂識別軟件Shazam。Shazam這個軟件,通過手機麥克風(fēng)收錄音頻片段,能夠識別音樂、電影、電視節(jié)目甚至是廣告。那么蘋果公司整合這項技術(shù)做什么?很大可能是為了其人工智能助理軟件Siri。
Siri使用自然語言處理技術(shù),是AI技術(shù)的一大體系,而隨著近年定義和產(chǎn)業(yè)分工越發(fā)精細,語言識別漸漸分成了語音識別和語義識別兩個支系。語音和語義雖只有一字之差,卻有很大的不同。
打個簡單的比方,語音識別相當(dāng)于是人的耳朵,而語義識別則是大腦,語音識別幫助機器獲取和輸出信息,那么語義識別則是對這些信息進行識別加工。
在這里,小編舉個例子來幫助大家更好的理解上面的話:
爸爸沒法舉起他的兒子,因為他很重。
問:誰重?
爸爸沒法舉起他的兒子,因為他很虛弱。
問:誰虛弱?
可以看到,這兩個句子結(jié)構(gòu)完全一致,后面的“他”指的到底是爸爸還是爸爸的兒子?這對于我們來說輕而易舉,因為我們有能清楚的通過我們積累的知識知道:爸爸舉不起兒子,要么兒子太重,爸爸舉不起;要么兒子不重,但是爸爸力氣小,比較虛弱,因此舉不起兒子。
但是對于一個只會語音識別的機器來說,它不會去思考句子中的“他”到底指的兒子還是爸爸,事實上,它也“想不清楚”。但是通過語義識別,機器會對聽到的信息進行加工理解,從而給出正確的答案。
與語音識別相比,顯然語義識別顯然要更深一個層次,用到的技術(shù)也更為復(fù)雜。
本文中,小編就給大家介紹一下人工智能中,自然語言識別這一重要支系。
語音識別發(fā)展史
語音是最自然的交流方式,自從1877年愛迪生發(fā)明了留聲機,人們就開始了與機器的交談,但是主要還是與人交流,而非機器本身。
1950年,計算機科學(xué)之父阿蘭·圖靈在《Mind》雜志上發(fā)表了題為《計算的機器和智能》的論文,首次提出了機器智能的概念,論文還提出了一種驗證機器是否有智能的方法:讓人和機器進行交流,如果人無法判斷自己交流的對象是人還是機器,就說明這個機器有智能了,這就是后來鼎鼎有名的人工智能圖靈測試。
到20世紀80年代,語音識別技術(shù)能夠?qū)⒖谡Z轉(zhuǎn)化為文本。
2001年,計算機語音識別達到了80%的準確度。從那時起,我們就可以提取口語語言的含義并作出回應(yīng)。然而,多數(shù)情況下,語音技術(shù)仍然不能像鍵盤輸入那樣帶給我們足夠好的交流體驗。
近幾年來,語音識別又取得了巨大的技術(shù)進步?拼笥嶏w董事長劉慶峰在一次演講中,在演講的同時使用著最新的智能語音識別技術(shù)——可以讓他演講的內(nèi)容實時以中英文雙字幕的形式呈現(xiàn)在大屏幕上,反應(yīng)迅速、幾乎沒錯。識別精確度超過95%。隨著這項技術(shù)的進步,語音優(yōu)先的基礎(chǔ)設(shè)施變得越來越重要,亞馬遜、蘋果、谷歌、微軟和百度都迅速部署了聲音優(yōu)先軟件、軟件構(gòu)建快和平臺。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7月31日免費預(yù)約>> OFweek 2025具身機器人動力電池技術(shù)應(yīng)用大會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題