訂閱
糾錯(cuò)
加入自媒體

思必馳打造高效率開(kāi)會(huì)神器,智能降噪、遠(yuǎn)程流暢通話、音頻轉(zhuǎn)寫(xiě)都是這樣實(shí)現(xiàn)的…

2022-02-18 16:10
來(lái)源: 粵訊

人工智能、云計(jì)算、物聯(lián)網(wǎng)等科技發(fā)展,企業(yè)紛紛進(jìn)行智能化戰(zhàn)略轉(zhuǎn)型和業(yè)務(wù)升級(jí),開(kāi)拓智能時(shí)代新藍(lán)海。智慧辦公作為AIoT升級(jí)和演進(jìn)方向之一,成為推動(dòng)經(jīng)濟(jì)發(fā)展、轉(zhuǎn)型升級(jí)、社會(huì)進(jìn)步的重要驅(qū)動(dòng)力量。

疫情讓辦公形式迎來(lái)多樣性的轉(zhuǎn)變。包括線上學(xué)習(xí)常常面臨準(zhǔn)確“記錄”聲音的困擾,因此拾音、降噪、轉(zhuǎn)寫(xiě)等能力顯得格外重要。依托麥克風(fēng)陣列、智能降噪算法、長(zhǎng)語(yǔ)音識(shí)別......思必馳目前已助力MAXHUB會(huì)議平板,飛利浦、紐曼、印象筆記、索尼等品牌錄音筆智能化升級(jí)。

AI加持,高效學(xué)習(xí)辦公

隨著人工智能在各行各業(yè)應(yīng)用深化,AI語(yǔ)音轉(zhuǎn)換文本市場(chǎng)規(guī)?涨。ReportLinker發(fā)布報(bào)告預(yù)計(jì),到2027年,全球文本語(yǔ)音轉(zhuǎn)換市場(chǎng)規(guī)模將達(dá)到60億美元。其中,美國(guó)的文本語(yǔ)音轉(zhuǎn)換市場(chǎng)預(yù)計(jì)將達(dá)到6.013億美元。中國(guó)文本語(yǔ)音轉(zhuǎn)換市場(chǎng)規(guī)模將達(dá)到13億美元。

在AI加持下,錄音筆、手機(jī)、平板電腦等這些錄音設(shè)備早已不再只是單純的進(jìn)行音頻記錄,它們能直接將音頻轉(zhuǎn)寫(xiě)成文字,還能對(duì)文字進(jìn)行編輯和處理,提升工作、學(xué)習(xí)效率。

思必馳打造高效率開(kāi)會(huì)神器,智能降噪、遠(yuǎn)程流暢通話、音頻轉(zhuǎn)寫(xiě)都是這樣實(shí)現(xiàn)的…

眾多錄音設(shè)備中,最常見(jiàn)的是錄音筆。紐曼多款A(yù)I錄音筆采用思必馳智能錄音筆解決方案,錄音筆連接到手機(jī)端或PC,即可實(shí)現(xiàn)音頻轉(zhuǎn)寫(xiě)、對(duì)話翻譯、空間及文本管理等多種功能。印象掃譯筆專業(yè)版(EverSCAN Pro)采用雙麥方案,搭載思必馳AI降噪算法,長(zhǎng)語(yǔ)音識(shí)別,不同場(chǎng)景下對(duì)噪音進(jìn)行多重優(yōu)化,清晰降噪,實(shí)現(xiàn)長(zhǎng)語(yǔ)音實(shí)時(shí)轉(zhuǎn)寫(xiě)、錄音文件轉(zhuǎn)寫(xiě)等功能。

索尼錄音筆、飛利浦錄音筆、MAXHUB會(huì)議平板等產(chǎn)品中目前均內(nèi)置了思必馳長(zhǎng)語(yǔ)音識(shí)別服務(wù)。思必馳長(zhǎng)語(yǔ)音識(shí)別服務(wù)支持實(shí)時(shí)識(shí)別與離線識(shí)別,識(shí)別準(zhǔn)確率可達(dá)98%(中國(guó)信息通信研究院檢測(cè),報(bào)告編號(hào):V21Y000005)。實(shí)時(shí)的錄音轉(zhuǎn)寫(xiě)功能,無(wú)論上課、開(kāi)會(huì)還是采訪,用戶都能快速準(zhǔn)確出稿,極大提升工作、學(xué)習(xí)效率。

遠(yuǎn)場(chǎng)+降噪,清晰自然交互

遠(yuǎn)程會(huì)議、線上學(xué)習(xí)場(chǎng)景,常常需要遠(yuǎn)場(chǎng)語(yǔ)音交互,并且伴隨著環(huán)境噪聲和人聲干擾。尤其在大型會(huì)議現(xiàn)場(chǎng),遠(yuǎn)距離拾音和噪聲盡管不會(huì)掩蓋正常語(yǔ)音通話,但是影響了清晰度。

針對(duì)遠(yuǎn)場(chǎng)交互和噪聲問(wèn)題,麥克風(fēng)陣列可以有效抑制噪聲。思必馳麥克風(fēng)陣列集成波束成形、回聲消除、聲源定位等算法,可拾取半徑5m內(nèi)的聲源,實(shí)現(xiàn)360°聲源定位,即使會(huì)議場(chǎng)景發(fā)言人之間遠(yuǎn)距離從多方位發(fā)聲,也可以輕松拾音。

思必馳打造高效率開(kāi)會(huì)神器,智能降噪、遠(yuǎn)程流暢通話、音頻轉(zhuǎn)寫(xiě)都是這樣實(shí)現(xiàn)的…

另外,新一代的智能降噪技術(shù)也是文本語(yǔ)音轉(zhuǎn)寫(xiě)的“法寶”。

傳統(tǒng)的噪音抑制方法只能作用于某些固定的穩(wěn)態(tài)噪音,如空調(diào)等電器的運(yùn)轉(zhuǎn)聲,而動(dòng)態(tài)噪音如開(kāi)關(guān)門(mén)聲和人的語(yǔ)音出現(xiàn)頻率重疊時(shí),傳統(tǒng)方法無(wú)法很好地抑制。隨著深度學(xué)習(xí)方法的飛速發(fā)展,更強(qiáng)大的深度神經(jīng)網(wǎng)絡(luò)被應(yīng)用于語(yǔ)音識(shí)別,包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)等。

思必馳智能降噪技術(shù)采用“傳統(tǒng)分離結(jié)合深度學(xué)習(xí)方案”,可以兼顧傳統(tǒng)信號(hào)處理的保真性和深度學(xué)習(xí)的非穩(wěn)態(tài)噪聲抑制能力,即在良好去除非穩(wěn)態(tài)噪聲的同時(shí)保證語(yǔ)音的較小失真,獲取純凈錄音,轉(zhuǎn)寫(xiě)文本更準(zhǔn)確。

說(shuō)話人識(shí)別,AI智能轉(zhuǎn)寫(xiě)

在論壇、大中小型會(huì)議、課堂等場(chǎng)景,參會(huì)者們滔滔不絕各抒己見(jiàn),準(zhǔn)確區(qū)分說(shuō)話人并分角色輸出文本,變成了語(yǔ)音轉(zhuǎn)寫(xiě)文字的一個(gè)重要標(biāo)準(zhǔn)。

人的聲紋具有特定的唯一性和穩(wěn)定性,聲紋識(shí)別可以通過(guò)聲紋辨別說(shuō)話人。在上述會(huì)議、課堂等多人混合說(shuō)話場(chǎng)景下,聲紋識(shí)別的目標(biāo)是讓機(jī)器將嘈雜環(huán)境下的多個(gè)混合說(shuō)話人的聲音分離,識(shí)別每個(gè)說(shuō)話人所說(shuō)的內(nèi)容并判斷每個(gè)說(shuō)話人的身份。

思必馳打造高效率開(kāi)會(huì)神器,智能降噪、遠(yuǎn)程流暢通話、音頻轉(zhuǎn)寫(xiě)都是這樣實(shí)現(xiàn)的…

思必馳針對(duì)會(huì)議、學(xué)習(xí)場(chǎng)景,智慧辦公解決方案對(duì)音頻的前端處理通過(guò)聲源分離技術(shù),通過(guò)DOA、聲紋識(shí)別技術(shù)辨別說(shuō)話人,拾音設(shè)備可以輕松區(qū)分說(shuō)話人角色,按“角色”轉(zhuǎn)寫(xiě)。結(jié)合算法降噪,盲源分離,提供相對(duì)更“干凈”的音頻文件;自動(dòng)標(biāo)點(diǎn)識(shí)別、數(shù)字化處理等自然語(yǔ)言處理能力,能夠讓識(shí)別結(jié)果更加準(zhǔn)確、規(guī)范。

結(jié)合長(zhǎng)語(yǔ)音識(shí)別、聲紋識(shí)別、AI降噪等,思必馳未來(lái)將持續(xù)助力企業(yè)實(shí)現(xiàn)降本增效,成就高效能人士。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)