科大訊飛:發(fā)布AI云,五大版塊構(gòu)建AI科技樹
發(fā)布AI云,五大版塊構(gòu)建AI科技樹
“企業(yè)數(shù)字化升級的終局是智能化,AI+大數(shù)據(jù)已經(jīng)成為拓寬新局面的決定性因素!笨拼笥嶏w集團(tuán)副總裁于繼棟在現(xiàn)場表示。
而為了更好地賦能企業(yè)數(shù)字化轉(zhuǎn)型,科大訊飛在現(xiàn)場帶來了全新生態(tài)新品——訊飛AI云。
根據(jù)現(xiàn)場介紹,訊飛AI云由磐石平臺和擎天平臺構(gòu)成,前者針對AI服務(wù)對云主機(jī)集群進(jìn)行了103項(xiàng)專業(yè)優(yōu)化,降本提效的同時(shí)進(jìn)行多種認(rèn)證和加密,從而保證臟專屬云用戶接入安全;后者定位“授人以漁”,從數(shù)據(jù)標(biāo)注、模型訓(xùn)練、引擎托管、服務(wù)編排等維度,滿足更多用戶不同業(yè)務(wù)場景組合下的AI需求。
隨著訊飛AI云的發(fā)布,我們可以預(yù)想到,在未來,訊飛開放平臺除了提供諸多AI基礎(chǔ)服務(wù)之外,還將能夠針對用戶更多個(gè)性化的需求提供高效服務(wù)。
與此同時(shí),科大訊飛AI研究院常務(wù)副院長劉聰也在大會現(xiàn)場提出“AI科技樹”構(gòu)造理念,并從5大板塊掀開了科大訊飛技術(shù)全景的一角。
具體來看,此次介紹的5大板塊分別是:
· 語音識別
科大訊飛的語音識別技術(shù)通過結(jié)合自學(xué)習(xí)更新的能力,可以對領(lǐng)域關(guān)鍵詞、應(yīng)用場景、口音、領(lǐng)域風(fēng)格等個(gè)性化需求進(jìn)行建模,真實(shí)、復(fù)雜場景下的語音交互也更自然。
這一技術(shù)上,科大訊飛還針對說話背景復(fù)雜多樣、多人說話語音混疊、文字內(nèi)容外的特殊聲音現(xiàn)象等問題,給出了全場景音頻解析的整體方案。
此外,針對包含語音的有效內(nèi)容,使用基于富信息的語音降噪和分離方案,綜合利用聲音、文本、說話人等信息。在有條件的情況下,還可以使用多模態(tài)的唇形、視線以及麥克風(fēng)陣列的空間位置等信息來進(jìn)行聯(lián)合建模,多次在國際語音識別與分離大賽中奪冠。
· 語音合成
過去,語音合成的效果主要用合成自然度MOS分來評估,但是未來的AI應(yīng)用,不光追求技術(shù)可實(shí)現(xiàn),還要更加人性化、更具有表現(xiàn)力、展示維度多模態(tài)。
科大訊飛的語音合成目前已經(jīng)能夠做到從語音到聲音的全場景音頻合成;谧匀徽Z言理解技術(shù),科大訊飛能夠從文本當(dāng)中分析到合適的情感焦點(diǎn),以及與角色相關(guān)的信息。與此同時(shí),他們也將單一的情感合成升級為微情緒合成,這意味著機(jī)器人能夠?qū)σ恍┚植康那楦凶龅骄珳?zhǔn)預(yù)測和控制,從而讓整個(gè)人機(jī)交互過程顯得更加具備趣味性和人情味。
· OCR識別
科大訊飛在OCR識別領(lǐng)域,做的可謂是細(xì)致入微。目前訊飛的OCR框架已經(jīng)進(jìn)化到了第四代篇章級的Encoder+Decoder,可以完成高精度二維復(fù)雜版面的端到端識別,相關(guān)能力調(diào)用量已經(jīng)超過10億次。
· 多語種
目前,科大訊飛現(xiàn)在已經(jīng)將語音合成、圖文識別等AI能力成功遷移到了多個(gè)語種,文檔拍照識別已經(jīng)支持56種語言,并且平均正確率超過了85%,機(jī)器翻譯更是擴(kuò)展到了168種語言。
· 行業(yè)認(rèn)知
當(dāng)前,科大訊飛基于在各個(gè)行業(yè)積累的豐富經(jīng)驗(yàn),構(gòu)建了一個(gè)行業(yè)認(rèn)知中臺,來降低問題定義的難度。
有了這個(gè)認(rèn)知中臺,就可以基本達(dá)到一個(gè)資深行業(yè)人士80%左右的認(rèn)知能力,讓場景定義的效率提升50%以上,而且認(rèn)知中臺可以完全私有化部署,數(shù)據(jù)安全無需擔(dān)憂。目前,基于認(rèn)知中臺的訊飛智醫(yī)機(jī)器人已經(jīng)拿到了執(zhí)業(yè)醫(yī)師資格證,這也是全球第一個(gè)拿到醫(yī)師執(zhí)照的機(jī)器人。
在演講的最后,劉聰表示:“除了上述的幾個(gè)方向,伴隨著科技樹枝葉的持續(xù)點(diǎn)亮,訊飛科技樹的全景已經(jīng)展現(xiàn)在大家的眼前。我想從原始的一顆種子發(fā)展到參天大樹,科技樹的每一片枝葉、每一個(gè)技術(shù)背后都蘊(yùn)含了大量的付出和努力!彼舱f到,未來科大訊飛會用科學(xué)的方法,合理有序的侯建科技樹,從而保證科技樹的根基穩(wěn)固,以及多個(gè)技術(shù)職業(yè)之間的高效協(xié)同。
最后
時(shí)至今日,科大訊飛1024開發(fā)者大會已經(jīng)辦過四屆,而距離訊飛開放平臺推出也已經(jīng)走過10年光陰。
前面也說到,這10年間,“(訊飛開放平臺)從早期的只有語音合成和識別兩個(gè)能力,到現(xiàn)在300多個(gè)AI能力。從最早的十幾個(gè)團(tuán)隊(duì),到現(xiàn)在超過150萬團(tuán)隊(duì)!迸c此同時(shí),平臺也已對外開放了334項(xiàng)AI能力及方案,鏈接超200萬生態(tài)合作伙伴,累計(jì)支持超過29.9億+終端。
在會后對開發(fā)者的采訪中,我們知悉了科大訊飛開發(fā)者競賽等項(xiàng)目對于他們的幫助,而反過來,開發(fā)者們的聚攏,也為科大訊飛的生態(tài)建設(shè)提供了極大的助力。正如劉慶峰所說,唯有生態(tài),才能生生不息!

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報(bào)名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長曲線
- 8 谷歌吹響AI沖鋒號,AI還有哪些機(jī)會
- 9 蘋果把身家押在Siri上:一場輸不起的自我革命
- 10 共探合作新機(jī)遇!江門市新會區(qū)(深圳)“AI + 機(jī)器人” 產(chǎn)業(yè)對接會成功舉辦