2020 年 10 篇必讀的 NLP 突破論文 LIST
9、聊天機器人 Meena
開放域聊天機器人仍然存在明顯的弱點,比如說它們的響應(yīng)通常沒有意義,或者過于模糊或籠統(tǒng)。
為了解決這些問題,谷歌研究團隊引入了 Meena(一個具有 2.6B 參數(shù)的生成式會話模型)。Meena 的 seq2seq 模型每層使用的是 Evolved Transformer (ET) 塊。Encoder 端使用了 1 個 ET 層(相當于 2 層 Transformer),Decoder 端使用了 13 個 ET 層(相當于 26 層 Transformer)。
在多回合會話中訓(xùn)練模型,輸入序列包括上下文的所有回合(最多 7 個),輸出序列為響應(yīng)。相比于 GPT-2 訓(xùn)練使用了 40GB 的文檔數(shù)據(jù),Meena 訓(xùn)練使用了 341GB 的對話數(shù)據(jù)。Meena 的模型參數(shù)規(guī)模達到了 2.6B,在 GPT-2 的基礎(chǔ)上又大了不少。
與此同時,為了測量諸如 Meena 之類的開放域聊天機器人的質(zhì)量,研究人員引入了一種新的人類評估指標,稱為敏感度和敏感度平均值(SSA),它可以測量聊天機器人的兩個基本方面 —— 有道理和具體。
Meena 的出現(xiàn)是一個進一步將計算機交互人性化的探索,可以幫助改善外語練習(xí)、使交互式電影和視頻游戲角色具有關(guān)聯(lián)性等應(yīng)用場景。
不過,考慮到模型中與安全性和偏差有關(guān)的挑戰(zhàn),研究團隊尚未開源該模型。
10、BlenderBot
Facebook AI Research 團隊顯示,有了適當?shù)挠?xùn)練數(shù)據(jù)和生成策略,大型模型可以學(xué)習(xí)許多重要的會話技巧,例如提高參與度、運用知識、富有同情心和保持角色一致性等等。
他們建立了一個先進的對話機器人,名為 “BlenderBot”。利用這個具有 9.4B 參數(shù)的模型,團隊對它進行了一項名為 Blended Skill Talk 的新任務(wù)的訓(xùn)練。
建立 BlenderBot 這樣的開放域聊天機器人,有以下三個關(guān)鍵要素:
?規(guī)模大。最大的模型具有 94 億個參數(shù),并在提取的對話的 15 億個訓(xùn)練示例中進行了訓(xùn)練。
?混合技能。聊天機器人接受了 “混合技能對話” 任務(wù)的培訓(xùn),以學(xué)習(xí)諸如使用個性,使用知識和表現(xiàn)同情心之類的技能。
?用于解碼的 Beam search 。
與上面的第九項研究 Meena 相比,F(xiàn)acebook 的這項工作進一步提升了基于預(yù)訓(xùn)練模型構(gòu)建的聊天機器人的回復(fù)效果,甚至在短對話(14 輪以下)的人工評估中獲得了非常接近人類的得分。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7月31日免費預(yù)約>> OFweek 2025具身機器人動力電池技術(shù)應(yīng)用大會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題