“搜狗聽寫”有何“殺手锏”?走近搜狗的人工智能戰(zhàn)略
就在一周前搜狗宣布赴美上市計(jì)劃的那天,搜狗公司CEO王小川在員工內(nèi)部信中寫了這樣一句話:“已經(jīng)沒有人會(huì)懷疑搜狗的生存問(wèn)題了,唯一的懸念是搜狗是否能在搜索領(lǐng)域?qū)崿F(xiàn)顛覆,是否能在人工智能領(lǐng)域引領(lǐng)重大的創(chuàng)新!币粫r(shí)間,王小川的“懸念”成為看點(diǎn)——8月8日,搜狗正式迎來(lái)了第一款語(yǔ)音技術(shù)產(chǎn)品“搜狗聽寫”。
語(yǔ)音實(shí)時(shí)轉(zhuǎn)文字背后有深度學(xué)習(xí)技術(shù)
搜狗聽寫的定位是“文字工作者的速記工具”。針對(duì)寫文章、采訪錄音、會(huì)議記錄、筆記整理 、日常記事等場(chǎng)景,以實(shí)現(xiàn)高效記錄和信息輸入。
搜狗聽寫最亮眼的功能在于“聽寫”和“轉(zhuǎn)寫”兩種模式!奥爩憽蹦J较,錄音的同時(shí)可以實(shí)時(shí)識(shí)別結(jié)果;而“轉(zhuǎn)寫”模式下則可以離線錄音,錄音完成后一次性獲取文字結(jié)果。
除此之外還有諸如支持手機(jī)邊聽邊改、無(wú)線標(biāo)重點(diǎn)(藍(lán)牙打點(diǎn))、多客戶端同步、信息分享、摘要、斷點(diǎn)續(xù)錄等人性化功能,另外,針對(duì)圖書館、咖啡廳等安靜場(chǎng)所,搜狗聽寫提供耳語(yǔ)識(shí)別技術(shù)——人說(shuō)話音量低至30分貝時(shí),依然可以準(zhǔn)確識(shí)別。
被牛露云稱作“大殺器”的一個(gè)功能,是搜狗聽寫與搜狗輸入法的個(gè)人詞庫(kù)已經(jīng)打通,可以視為媒體撰稿人之間文字互通的功能。
關(guān)于下載,搜狗聽寫除了支持Android、ios版本之外,還開發(fā)了Windows版,Windows版特別針對(duì)會(huì)議場(chǎng)景,觀眾可以直接看到會(huì)議演講者的實(shí)時(shí)字幕,字幕可能是直接文字的轉(zhuǎn)寫結(jié)果,也有可能是雙語(yǔ)、多語(yǔ)對(duì)照結(jié)果,觀眾甚至可以直接掃碼獲取當(dāng)天的錄音和文本結(jié)果。
這樣一款語(yǔ)音識(shí)別產(chǎn)品,實(shí)際上是基于深度學(xué)習(xí)技術(shù),以提升復(fù)雜場(chǎng)景識(shí)別效果。
說(shuō)到深度學(xué)習(xí),離不開三要素:有沒有大數(shù)據(jù),有沒有好的深度學(xué)習(xí)算法,以及能不能讓深度學(xué)習(xí)算法在深度學(xué)習(xí)平臺(tái)上高效運(yùn)轉(zhuǎn)。
搜狗語(yǔ)音交互中心技術(shù)總監(jiān)陳偉介紹,“搜狗輸入法每天語(yǔ)音識(shí)別的PV是2.6億次,產(chǎn)生的語(yǔ)料規(guī)模是22萬(wàn)小時(shí)!标P(guān)于算法,搜狗早期較多使用深度神經(jīng)網(wǎng)絡(luò),隨后嘗試了CN算法、LSTM的算法,現(xiàn)在轉(zhuǎn)為CN+LSTM+DN的端到端的算法,可以更高效,準(zhǔn)確率更高。
有了數(shù)據(jù)+算法,接下來(lái)就是運(yùn)算,如何高效的給出模型以快速部署到線上,關(guān)鍵在于搜狗的深度學(xué)習(xí)平臺(tái)!拔覀兛梢栽谧杂械纳疃葘W(xué)習(xí)平臺(tái)上調(diào)動(dòng)上百塊算卡,快速的給出模型!标悅フf(shuō)。
實(shí)際上,目前市場(chǎng)上已有一些同類型的產(chǎn)品,例如科大訊發(fā)早期推出的訊飛聽見等,相比之下,搜狗是否存在優(yōu)勢(shì)呢?搜狗語(yǔ)音交互中心負(fù)責(zé)人王硯峰表示:
第一,訊飛對(duì)應(yīng)的產(chǎn)品,如訊飛聽見、訊飛錄音寶等,是不能支持長(zhǎng)時(shí)間錄音、并且免費(fèi)轉(zhuǎn)寫的。而搜狗是首次做了長(zhǎng)時(shí)錄音設(shè)置,并且支持免費(fèi)轉(zhuǎn)寫。
第二,搜狗的產(chǎn)品是面向垂直場(chǎng)景,包括記者采訪的場(chǎng)景、作家寫作的場(chǎng)景等等。這些功能雖小,但它體現(xiàn)在具體場(chǎng)景下,怎么絞盡腦汁的想盡辦法,幫朋友解決問(wèn)題。
第三,搜狗聽寫支持手機(jī)端和windows,還有語(yǔ)音實(shí)時(shí)轉(zhuǎn)文字、邊聽邊改、標(biāo)重點(diǎn)、快速查找、多端同步、不限時(shí)長(zhǎng)錄音等功能。
此外,依托搜狗日均超過(guò)2.6億次的語(yǔ)音請(qǐng)求,提供海量的真實(shí)語(yǔ)料數(shù)據(jù),可以使得機(jī)器不斷學(xué)習(xí),不斷提升識(shí)別準(zhǔn)確率,可應(yīng)用的場(chǎng)景也越來(lái)越廣泛。
但對(duì)于搜狗轉(zhuǎn)寫免費(fèi)會(huì)持續(xù)多長(zhǎng)時(shí)間這個(gè)問(wèn)題,王硯峰表示,目前肯定是免費(fèi)的,至于之后會(huì)不會(huì)收費(fèi),并不完全確定。至少按照現(xiàn)有的產(chǎn)品形態(tài),肯定是在相當(dāng)長(zhǎng)的時(shí)間內(nèi)不考慮使用這個(gè)產(chǎn)品來(lái)賺錢。作為一家互聯(lián)網(wǎng)公司,通過(guò)技術(shù)來(lái)收取技術(shù)服務(wù)費(fèi)不是搜狗的商業(yè)邏輯。至少到現(xiàn)在為止,搜狗還不想通過(guò)產(chǎn)品收費(fèi)的方式來(lái)進(jìn)行商業(yè)變現(xiàn)。
搜狗語(yǔ)音交互中心負(fù)責(zé)人王硯峰

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車研發(fā)中心重磅落地,寶馬家門口“搶人”
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線
- 8 谷歌吹響AI沖鋒號(hào),AI還有哪些機(jī)會(huì)
- 9 蘋果把身家押在Siri上:一場(chǎng)輸不起的自我革命
- 10 共探合作新機(jī)遇!江門市新會(huì)區(qū)(深圳)“AI + 機(jī)器人” 產(chǎn)業(yè)對(duì)接會(huì)成功舉辦