17 Transformer 的解碼器（Decoders）——我要生成一個又一個單詞

原創

2022-07-13 13:32

博客配套視頻鏈接: https://space.bilibili.com/383551518?spm_id_from=333.1007.0.0 b 站直接看

配套 github 鏈接：https://github.com/nickchen121/Pre-training-language-model

配套博客鏈接：https://www.cnblogs.com/nickchen121/p/15105048.html

Transformer 編碼器

編碼器在幹嗎：詞向量、圖片向量，總而言之，編碼器就是讓計算機能夠更合理地（不確定性的）認識人類世界客觀存在的一些東西

Transformer 解碼器

解碼器會接收編碼器生成的詞向量，然後通過這個詞向量去生成翻譯的結果。

解碼器的 Self-Attention 在編碼已經生成的單詞

假如目標詞“我是一個學生”---》masked Self-Attention

訓練階段：目標詞“我是一個學生”是已知的，然後 Self-Attention 是對“我是一個學生” 做計算

如果不做 masked，每次訓練階段，都會獲得全部的信息

如果做 masked，Self-Attention 第一次對“我”做計算

Self-Attention 第二次對“我是”做計算

……

測試階段：

目標詞未知，假設目標詞是“我是一個學生”（未知），Self-Attention 第一次對“我”做計算
第二次對“我是”做計算
……

而測試階段，沒生成一點，獲得一點

生成詞

Linear 層轉換成詞表的維度

softmax 得到最大詞的概率

softmax 細話

單詞表

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

反模式 DI anti-patterns

反模式 DI anti-patterns反模式DI anti-patterns 一、一、反模式 DI anti-patterns 1. 控制狂 Control freak 在程序設計中，"Control freak"（控制狂）通

2024-05-26 14:24:02

Win10 LTSC 2019 安裝後的一些步驟

僅作爲自己記錄使用。 1.調整Windows恢復分區(Windows RE)大小[可忽略] Win10系統更新(KB5034441)在更新時會報錯 (0x80070643)，與Win10安裝時初始化的Windows恢復分區太小有關，因此建議

2024-05-26 14:20:52

Python 潮流週刊#52：Python 處理 Excel 的資源

本週刊由 Python貓出品，精心篩選國內外的 250+ 信息源，爲你挑選最值得分享的文章、教程、開源項目、軟件工具、播客和視頻、熱門話題等內容。願景：幫助所有讀者精進 Python 技術，並增長職業和副業的收入。本期週刊分享了 12

豌豆花下貓

2024-05-26 14:19:11

我對微服務架構的簡單理解

在寫架構的時候，就要想着，哪些功能是要以後可能要單獨部署的，雖然一開始寫的時候可以寫在一個解決方案裏，但那些請求的dto，和返回的視圖，業務依賴，能隨時獨立出去，完全不需要做任何操作，即使是文件夾複製移動都不需要，就能夠把該功能獨立成一個解

2024-05-26 14:17:01

賽克oj The diameter of a rectangle（笛卡爾樹）

賽氪OJ-專注於算法競賽的在線評測系統 (saikr.com) 這題是hduoj 1506的加強版，區別在於寬度不是固定爲1了，思路差不多，也是使用笛卡爾樹。參考hduoj 1506（笛卡爾樹） - Venux - 博客園 (cnblogs

2024-05-26 14:10:21

hduoj 1506（笛卡爾樹）

Problem - 1506 (hdu.edu.cn) 題意座標軸給定一些矩形，緊密排在一起，每個矩形寬度固定爲1，問形成的圖案中最大可以組成的矩形面積。思路常規思路是可以用單調棧分別找兩邊的合法邊界，這裏使用笛卡爾樹。笛卡爾樹實現了

2024-05-26 14:10:21

C# enum枚舉爲0的時候不需要強制轉換，很容易掉坑

重載的時候優先級很高很容易掉坑裏面了

2024-05-26 14:09:41

Qt支持heic圖片顯示

目錄一、背景二、Heic圖片顯示heif庫安裝圖片顯示三、參考文章原文鏈接：Qt支持heic圖片顯示一、背景小孩子兩歲了，最近在着手給娃做生活照紀念相冊，然後就是某寶上各種聊，瞭解到的相冊種類也是各異，價格更是良莠不齊，小几十到小几百

2024-05-26 14:08:50

Spring的BeanFactoryPostProcessor和BeanPostProcessor區別？

1、BeanFactoryPostProcessor是用於在容器實例化Bean之前對Bean的配置信息進行修改的接口，它允許對BeanFactory進行後處理，比如修改BeanDefinition的屬性值等。 BeanFactoryPo

2024-05-26 14:02:20

WPF一個簡單的屬性編輯控件

代碼： public class PropertiesControl : Grid { [TypeConverter(typeof(LengthConverter))] public d

2024-05-26 14:02:00

外企也半夜發佈上線嗎？

0 別把問題想得太複雜如果有灰度發佈的能力，最好白天發佈；如果沒有灰度發佈，只能在半夜發佈。即使有灰度發佈能力，也不要沾沾自喜，好好反思一下你們的灰度發佈是否真的經得起考驗，還是僅僅是裝裝樣子。回滾方案最好在上級環境中使用生產數

路人111122233

2024-05-26 14:00:39

從零手寫實現 nginx-01-爲什麼不能有 java 版本的 nginx?

前言大家好，我是老馬。很高興遇到你。作爲一個 java 開發者，工作中一直在使用 nginx。卻發現一直停留在使用層面，無法深入理解。有一天我在想，爲什麼不能有一個 java 版本的 nginx 呢？一者是理解 nginx 的設計靈

2024-05-26 13:59:39

Nginx R31 doc-11-Compression and Decompression 壓縮與解壓縮

前言大家好，我是老馬。很高興遇到你。我們爲 java 開發者實現了 java 版本的 nginx https://github.com/houbb/nginx4j 如果你想知道 servlet 如何處理的，可以參考我的另一個項目：

2024-05-26 13:59:39

【轉】centos7.9源碼安裝mysql5.7.44

原文：https://blog.csdn.net/SeeYouGoodBye/article/details/135231451 1、環境介紹 centos7.9 mysql5.7.44 boost1.59.0 注意：這裏的編譯版本my

2024-05-26 13:58:49

prompt內容

# 角色你的名字叫小二招聘管家 ## 技能### 技能1: 職位需求分析- 透徹理解企業招聘需求，明確崗位職責、必備技能和資格要求。- 分析企業文化與團隊結構，確保候選人與企業環境的契合度。 ### 技能2: 簡歷篩選與評估- 快速瀏覽並篩

2024-05-26 13:58:19

24小時熱門文章

Python 潮流週刊#52：Python 處理 Excel 的資源

最新文章

最新評論文章