科大訊飛:發(fā)布AI云,五大版塊構(gòu)建AI科技樹
發(fā)布AI云,五大版塊構(gòu)建AI科技樹
“企業(yè)數(shù)字化升級的終局是智能化,AI+大數(shù)據(jù)已經(jīng)成為拓寬新局面的決定性因素!笨拼笥嶏w集團(tuán)副總裁于繼棟在現(xiàn)場表示。
而為了更好地賦能企業(yè)數(shù)字化轉(zhuǎn)型,科大訊飛在現(xiàn)場帶來了全新生態(tài)新品——訊飛AI云。
根據(jù)現(xiàn)場介紹,訊飛AI云由磐石平臺和擎天平臺構(gòu)成,前者針對AI服務(wù)對云主機(jī)集群進(jìn)行了103項(xiàng)專業(yè)優(yōu)化,降本提效的同時進(jìn)行多種認(rèn)證和加密,從而保證臟專屬云用戶接入安全;后者定位“授人以漁”,從數(shù)據(jù)標(biāo)注、模型訓(xùn)練、引擎托管、服務(wù)編排等維度,滿足更多用戶不同業(yè)務(wù)場景組合下的AI需求。
隨著訊飛AI云的發(fā)布,我們可以預(yù)想到,在未來,訊飛開放平臺除了提供諸多AI基礎(chǔ)服務(wù)之外,還將能夠針對用戶更多個性化的需求提供高效服務(wù)。
與此同時,科大訊飛AI研究院常務(wù)副院長劉聰也在大會現(xiàn)場提出“AI科技樹”構(gòu)造理念,并從5大板塊掀開了科大訊飛技術(shù)全景的一角。
具體來看,此次介紹的5大板塊分別是:
· 語音識別
科大訊飛的語音識別技術(shù)通過結(jié)合自學(xué)習(xí)更新的能力,可以對領(lǐng)域關(guān)鍵詞、應(yīng)用場景、口音、領(lǐng)域風(fēng)格等個性化需求進(jìn)行建模,真實(shí)、復(fù)雜場景下的語音交互也更自然。
這一技術(shù)上,科大訊飛還針對說話背景復(fù)雜多樣、多人說話語音混疊、文字內(nèi)容外的特殊聲音現(xiàn)象等問題,給出了全場景音頻解析的整體方案。
此外,針對包含語音的有效內(nèi)容,使用基于富信息的語音降噪和分離方案,綜合利用聲音、文本、說話人等信息。在有條件的情況下,還可以使用多模態(tài)的唇形、視線以及麥克風(fēng)陣列的空間位置等信息來進(jìn)行聯(lián)合建模,多次在國際語音識別與分離大賽中奪冠。
· 語音合成
過去,語音合成的效果主要用合成自然度MOS分來評估,但是未來的AI應(yīng)用,不光追求技術(shù)可實(shí)現(xiàn),還要更加人性化、更具有表現(xiàn)力、展示維度多模態(tài)。
科大訊飛的語音合成目前已經(jīng)能夠做到從語音到聲音的全場景音頻合成;谧匀徽Z言理解技術(shù),科大訊飛能夠從文本當(dāng)中分析到合適的情感焦點(diǎn),以及與角色相關(guān)的信息。與此同時,他們也將單一的情感合成升級為微情緒合成,這意味著機(jī)器人能夠?qū)σ恍┚植康那楦凶龅骄珳?zhǔn)預(yù)測和控制,從而讓整個人機(jī)交互過程顯得更加具備趣味性和人情味。
· OCR識別
科大訊飛在OCR識別領(lǐng)域,做的可謂是細(xì)致入微。目前訊飛的OCR框架已經(jīng)進(jìn)化到了第四代篇章級的Encoder+Decoder,可以完成高精度二維復(fù)雜版面的端到端識別,相關(guān)能力調(diào)用量已經(jīng)超過10億次。
· 多語種
目前,科大訊飛現(xiàn)在已經(jīng)將語音合成、圖文識別等AI能力成功遷移到了多個語種,文檔拍照識別已經(jīng)支持56種語言,并且平均正確率超過了85%,機(jī)器翻譯更是擴(kuò)展到了168種語言。
· 行業(yè)認(rèn)知
當(dāng)前,科大訊飛基于在各個行業(yè)積累的豐富經(jīng)驗(yàn),構(gòu)建了一個行業(yè)認(rèn)知中臺,來降低問題定義的難度。
有了這個認(rèn)知中臺,就可以基本達(dá)到一個資深行業(yè)人士80%左右的認(rèn)知能力,讓場景定義的效率提升50%以上,而且認(rèn)知中臺可以完全私有化部署,數(shù)據(jù)安全無需擔(dān)憂。目前,基于認(rèn)知中臺的訊飛智醫(yī)機(jī)器人已經(jīng)拿到了執(zhí)業(yè)醫(yī)師資格證,這也是全球第一個拿到醫(yī)師執(zhí)照的機(jī)器人。
在演講的最后,劉聰表示:“除了上述的幾個方向,伴隨著科技樹枝葉的持續(xù)點(diǎn)亮,訊飛科技樹的全景已經(jīng)展現(xiàn)在大家的眼前。我想從原始的一顆種子發(fā)展到參天大樹,科技樹的每一片枝葉、每一個技術(shù)背后都蘊(yùn)含了大量的付出和努力!彼舱f到,未來科大訊飛會用科學(xué)的方法,合理有序的侯建科技樹,從而保證科技樹的根基穩(wěn)固,以及多個技術(shù)職業(yè)之間的高效協(xié)同。
最后
時至今日,科大訊飛1024開發(fā)者大會已經(jīng)辦過四屆,而距離訊飛開放平臺推出也已經(jīng)走過10年光陰。
前面也說到,這10年間,“(訊飛開放平臺)從早期的只有語音合成和識別兩個能力,到現(xiàn)在300多個AI能力。從最早的十幾個團(tuán)隊(duì),到現(xiàn)在超過150萬團(tuán)隊(duì)!迸c此同時,平臺也已對外開放了334項(xiàng)AI能力及方案,鏈接超200萬生態(tài)合作伙伴,累計(jì)支持超過29.9億+終端。
在會后對開發(fā)者的采訪中,我們知悉了科大訊飛開發(fā)者競賽等項(xiàng)目對于他們的幫助,而反過來,開發(fā)者們的聚攏,也為科大訊飛的生態(tài)建設(shè)提供了極大的助力。正如劉慶峰所說,唯有生態(tài),才能生生不息!

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題