CH2-NLG應用之【機器翻譯non-auto-regressive版】

原創

2020-07-07 08:10

2018年，Gu等人提出了一種新的機器翻譯模型，這種模型不用再從左到右的順序依次翻譯了，使得翻譯過程可以並行化。

模型本身依然是基於Transformer的，不同的是在測試時可以並行解碼。模型結構如下圖所示：

把並行計算結果時，不同位置之間的詞獨立帶來的問題歸結爲訓練樣本中存在 multimodal target distribution的問題。找到一個很好的切入點，並通過引入隱含變量來降低mode的空間，幫助decoder進行decode。同時論文中採用knowledge distillation的方式，利用auto-regressive model來幫助模型進行訓練，也是一個非常好的做法。最終使得，模型在non-auto-regressive的情況下，達到了auto-regressive模型的效果。

TODO具體的論文閱讀

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

sorted 在python2和3中的區別

文章目錄sorted 在python2和3中的區別 sorted 在python2和3中的區別 python3中取消了cmp參數 python3中的使用方法如下: from functools import cmp_to_key

2020-07-08 12:31:35

monggoDB學習筆記

1、mongo是什麼關鍵詞：分佈式、可擴展、介於關係與非關係數據庫之間、文檔存儲、JSON格式存儲（可對字段建索引，實現關係數據庫的某些功能）、默認監聽端口27017 MongoDB是一個基於分佈式文件存儲的開源數據庫系統。由C++語言

2020-07-08 12:27:44

Shell編程入門（二）

多練習纔會記得牢這裏的題目來自於（個別刪選）知乎：shell編程如果當前用戶是管理員，則使用yum 安裝 vsftpd,如果不是,則提示您非管理員，不可安裝提示用戶輸入用戶名和密碼,腳本自動創建相應的賬戶及配置密碼。

存在即合理_

2020-07-08 11:22:52

在使用Django出現的疑難雜症

不知道會被笑的點讀法 Django的讀法是 [ˈdʒæŋɡo] 中文發音是迪亞戈重點是D 是輕輔音，讀出來的時候有點像是不發音。版本問題 Python3.0在 2020年是不支持 Django 3.0.4版本的。Djan

存在即合理_

2020-07-08 11:22:52

運維入門（一）

專業名詞出包：項目在執行機上運行，打包出結果，再由運維工程師轉交給開發工程師的一項活動。門禁：門禁指的是CICD的門禁，是指必要的時候進行一系列測試，以保證代碼的質量和其功能是否實現。一般由CI集成工具完成搭建與配置。門禁設

存在即合理_

2020-07-08 11:22:52

Shell編程入門（三）

簡單的Shell 命令 ll /usr/bin/java ll命令顯示詳細信息，如果java是一個目錄，顯示目錄中文件的詳細信息，如果java是一個軟連接，顯示軟連接的指向 ll ‘which java’ 顯示命令的詳細信息

存在即合理_

2020-07-08 11:22:52

Android M 新特性

六大特性： App Permission （軟件權限管理）安裝時候不會提醒權限，而是在使用時候由程序請求權限；用戶也可以在設置中對應用進行相關權限控制Chrome Custom Tags (網頁體驗提升) 登陸網站存儲密碼，自動補全資料

Jay白色风车

2020-07-08 10:03:22

學習筆記----伸展樹

最近在看伸展樹，看到了一個不錯的文章，轉載一下便於以後學習轉載地址：http://dongxicheng.org/structure/splay-tree/ 1、概述二叉查找樹（Binary Search Tree，也叫二

2020-07-08 09:04:26

mini2440開發板學習裸機開發——day1 裸機運行LED燈程序

開發背景：系統：ubuntu18.04系統開發板:mini2440 串口連接工具 J-link連接工具工具：secureCRT J-link 本次學習基於韋東山老師的嵌入式linux應用開發手冊書，結合友善之臂給出的官方資料以

2020-07-08 08:59:17

java入門程序100例學習筆記（005遞歸調用）

問題：兩年期整存零取，每月1000元，年利率1.17，問應存多少錢思路：使用遞歸調用實現：問題：局部變量的問題，變量的定義應該放在哪裏總結：遞歸要掌握好代碼下載鏈接：http://download.csdn.net/detai

2020-07-08 06:59:06

pandas數據分析讀書筆記（五）

plt.xlabel()，畫x軸標題 Plt.ylabel()，畫y軸標題 Plt.savefig(‘figpath.png’)，把圖片保存爲文件 S = pd.Series(np.random.randn(10).cumsum())

2020-07-08 06:46:51

Spring+SpringMVC+Mybatis項目中pom.xml模板

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaL

2020-07-08 06:30:02

Redis在Windows系統下安裝成服務

我們知道Redis沒有Windows系統的安裝版。Windows系統下使用Redis，每次都要打開他的redis-server.exe，並保持cmd窗口不關閉，才能正常使用。要是一不小心關掉cmd窗口，那Redis服務也關閉了。其實Re

2020-07-08 06:30:02

小程序數據請求注意事項

本文僅作爲個人學習經驗總結，如有理解有誤的地方，歡迎在評論區指出，謝謝！1.小程序的請求格式官方文檔中有明確的說明，不懂得可以看官方文檔，微信小程序開發文檔2.微信只支持https的請求方式3.文檔中要求，客戶端的 HTTPS TLS

2020-07-08 04:25:07

js原生事件封裝

自己寫的js事件的一些封裝，僅做學習筆記使用第一部分 event 添加事件，刪除事件，以及冒泡的屏蔽，並都做了兼容性的處理<span style="font-size:24px;">var event = { //添加句柄添

2020-07-08 04:25:07

24小時熱門文章

最新文章

最新評論文章