車萬翔教授:ACL 2010-2020 研究趨勢總結(jié)
文本生成強勢上升
嚴(yán)格來講自然語言處理應(yīng)被分為自然語言處理和自然語言生成兩個方向,然而受到技術(shù)的限制,傳統(tǒng)的文本生成多采用基于模板的方法,因此在研究上并沒有引起太多的關(guān)注。隨著序列到序列模型的產(chǎn)生,人們意識到可以采用類似的方法進行逐詞的文本生成,從而產(chǎn)生了大量的研究和應(yīng)用問題,因此文本生成也成為了目前自然語言處理的熱門研究領(lǐng)域。今年ACL上的研究熱點如下圖所示。
問答系統(tǒng)絕地反擊
隨著斯坦福大學(xué)SQuAD數(shù)據(jù)集的誕生,以抽取式閱讀理解為代表的問答系統(tǒng)近年來引起了大量的關(guān)注。但是為什么說是“絕地反擊”呢?主要是因為在更久之前,問答系統(tǒng)就曾經(jīng)是信息檢索和自然語言處理領(lǐng)域的熱門研究方向,但是受限于當(dāng)時的技術(shù)手段,答案準(zhǔn)確率并不是很高,因此該研究方向曾一度被人們所冷落。經(jīng)過這幾年的發(fā)展,問答系統(tǒng)的模型逐漸被預(yù)訓(xùn)練模型所統(tǒng)一,因此今年ACL上的相關(guān)文章更關(guān)注問答系統(tǒng)的各個子任務(wù)或引入更多資源。
新任務(wù)和資源挑戰(zhàn)機器
仍然是受預(yù)訓(xùn)練模型的影響,在很多剛被提出不久的自然語言處理任務(wù)上,機器的表現(xiàn)很快超過人類。因此最近有大量的研究工作試圖提出對機器更具有挑戰(zhàn)性的任務(wù)和資源,從而逼迫機器更像人一樣“思考”。
機器翻譯有所衰落
幾家歡樂幾家愁,由于上述領(lǐng)域的快速崛起,更重要的是由于模型逐漸為Transformer所統(tǒng)一,使得機器翻譯這一“老牌”自然語言處理任務(wù)受關(guān)注的程度有所降低。今年ACL的相關(guān)研究也分散到不同的翻譯場景設(shè)置上。
句法分析逐漸式微
和機器翻譯類似,句法分析這一曾經(jīng)自然語言處理領(lǐng)域的當(dāng)家任務(wù)也逐漸式微。其背后的原因有兩個:一方面是因為Biaffine Parser的出現(xiàn)證明了結(jié)構(gòu)學(xué)習(xí)這一自然語言處理的特色問題,對于句法分析并不重要;另一方面,預(yù)訓(xùn)練模型的出現(xiàn)使得句法分析的處境更是雪上加霜。預(yù)訓(xùn)練模型不但能大幅提高句法分析的效果,更重要的是其內(nèi)部已經(jīng)蘊含了句法結(jié)構(gòu)信息,因此就無需為下游任務(wù)提供顯式的句法結(jié)構(gòu)了。由于這些原因,今年ACL上句法分析的熱點也主要集中在了研究探針任務(wù)和句法分析的應(yīng)用上了。不過蘇州大學(xué)李正華老師所提出的高階TreeCRF模型還是能進一步提升句法分析的效果,這一點非常難得。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預(yù)約>> OFweek 2025具身智能機器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題