中文語音處理在數(shù)字助聽器系統(tǒng)的開發(fā)設(shè)計(jì)
一.中文語音技術(shù)處理原理
中文語音處理策略的英文詞有 “Chinese speech processing strategy” 或 “Chinese speech recognition”, ( 中文語音識(shí)別 ) 和 “hearing aid algorithm” ( 助聽器算法 ) 等。其中, algorithm ,即 “ 算法 ” 一詞使用較多,尤其涉及到數(shù)字助聽器的開發(fā), “ 算法 ” 代表了某一特殊技術(shù)的核心。 “ 算法 ” 可以被簡單地看作為實(shí)現(xiàn)某些特定信號(hào)處理功能的指令序列。中文語音特征可以通過算法研究來形成的。數(shù)字信號(hào)處理器和算法構(gòu)成了數(shù)字助聽器的 DSP 線路。包含多通道動(dòng)態(tài)范圍壓縮、噪音衰減等處理,設(shè)計(jì)助聽器的算法的主要目標(biāo)是利用中文語音處理技術(shù),即使在不同的聽音環(huán)境中,須確保言語被聽見并聆聽舒適。同時(shí),利用數(shù)字助聽器改善漢語可懂度,使有聽力損失的中國患者能更容易地理解漢語。
漢語是聲調(diào)單字語言,聲調(diào)是漢語的重要語音特征之一。聲調(diào)特征主要體現(xiàn)在嗓音基頻隨時(shí)間變化的模式上。 Eady 技術(shù) (1982) 曾考察過聲調(diào)語言 — 漢語的基頻模式與重音語言 — 英語有什么不同。漢語的聲調(diào)在詞語中具有辯意作用,在生活實(shí)踐當(dāng)中,大家也都能體會(huì)到聲調(diào)有助于我們聽懂別人的話,而 “ 南腔北調(diào) ” 常表示不易聽懂和不大好懂和不大好聽的意思。
對(duì)于連續(xù)言語來說,長時(shí)間平均的正、負(fù)顫動(dòng)因數(shù),各種語言和男女發(fā)音人是差不多的。只是負(fù)顫動(dòng)總是比正顫動(dòng)大,而且出現(xiàn)頻率也較高。 Eady 的測量結(jié)果表明,漢語的說話速度要比英語慢一些。這可能是由于說漢語時(shí),說話人要花更大的努力在每一個(gè)音節(jié)上來控制聲帶運(yùn)動(dòng),也就是說聲調(diào)語言的音節(jié)喉運(yùn)動(dòng)控制有較大的語言學(xué)負(fù)荷,因而花的時(shí)間就多一些。結(jié)果就表現(xiàn)為說話慢一些。
因此,聲調(diào)信息主要存在于基頻隨時(shí)間的變化中,強(qiáng)度變化對(duì)聲調(diào)信息有補(bǔ)償作用,以及清輔音的存在與否對(duì)聲調(diào)清晰度是有一定的影響的。
1 原理 (Principles)
本文介紹一種可應(yīng)用于數(shù)字助聽器的提高漢語可懂度的語音處理方法,其目標(biāo)是使以漢語為母語的聽殘人士能更容易地理解語言。增強(qiáng)言語可懂度的思路來源于人們的實(shí)踐經(jīng)驗(yàn);叵胍幌,當(dāng)你為使一個(gè)有聽力障礙的人更容易聽懂自己說話時(shí)所采用的方法:你不僅僅要提高音量,而且還要改變發(fā)音方式,說得更慢和更清晰。一些研究表明清楚地讀無意義的語句,比在日常會(huì)話句子,大約能提高 17% 的單詞可懂度。這里所謂說得更清晰是指強(qiáng)調(diào)言語信號(hào)中的某些暗示,這些暗示有許多不同的形式,如特定音段的持續(xù)時(shí)間,元音的共振峰位置或者音素之間的過渡等。
不是所有人都會(huì)簡單地、方便地對(duì)聽力損失患者 “ 清楚地 ” 講話。因此,我們要采用言語增強(qiáng)的方法就是在說話人和聽話人中間構(gòu)造一個(gè)處理模型,該模型能強(qiáng)調(diào)并突出語句中的特定成分,使語句聽起來更清晰。
一切語音之所以能夠表達(dá)意義,是由于各個(gè)音之間存在區(qū)別。這些區(qū)別產(chǎn)生于聲腔內(nèi)部的器官和肌肉等活動(dòng)決定的發(fā)音方法和發(fā)音部位的差異,同時(shí)又表現(xiàn)為語音的聲學(xué)特征的差異。本文提出的言語增強(qiáng)的方法正是通過對(duì)語音信號(hào)的重構(gòu)來強(qiáng)化這些差異。所謂重構(gòu)是指對(duì)語音信號(hào)中不同性質(zhì)的信號(hào)進(jìn)行識(shí)別并有針對(duì)性地予以處理,強(qiáng)調(diào)其中對(duì)人的感知起作用的特征,從而達(dá)到提高言語清晰度的目的。該方法可以簡單地概括為:放大輔音、強(qiáng)調(diào)重音和突出聲調(diào)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
圖片新聞
技術(shù)文庫
最新活動(dòng)更多
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月30-31日報(bào)名參會(huì)>>> 全數(shù)會(huì)2025中國激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會(huì)
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
精彩回顧立即查看>> 【線下論壇】新唐科技2025新品發(fā)布會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】研華嵌入式核心優(yōu)勢,以Edge AI驅(qū)動(dòng)機(jī)器視覺升級(jí)
-
精彩回顧立即查看>> OFweek 2025(第十四屆)中國機(jī)器人產(chǎn)業(yè)大會(huì)
- 1 中國疫苗,邁入新周期
- 2 License-out潮來襲:誰是下一個(gè)出海爆款?
- 3 起底“神藥”艾本那肽
- 4 港股創(chuàng)新藥走出至暗時(shí)刻
- 5 Summit跌完康方生物跌:尚未抵達(dá)“金標(biāo)準(zhǔn)”的依沃西,難道真被高估了?
- 6 2025 ASCO 回顧 | 雙抗與ADC成為中國創(chuàng)新藥的“雙引擎”!
- 7 多股大漲,醫(yī)藥行業(yè)的商業(yè)變現(xiàn)周期走到哪了?
- 8 2025 ADA前瞻:中國創(chuàng)新藥的“破圈”與“突圍”(附摘要匯總)
- 9 癌癥治療中的耐藥困局:從機(jī)制解析到破局之道
- 10 誰是下一個(gè)三生制藥?