解碼之Beam Search算法

原創

加勒比海鲜

2018-08-22 04:57

解碼是seq2seq模型的常見問題，常用方法有貪心搜索（Greedy Search）集束搜索（Beam Search）。

簡單貪心搜索

From [1]

如圖，Decoder根據Encoder的中間語義編碼向量 $c$ 和<s>標籤得到第一個輸出的概率分佈 $[0.1, 0.1, 0.3, 0.4, 0.1]$ ，選擇概率最大的0.4，即moi。

根據隱向量 $h_{1}$ 和moi得到第二個輸出的概率分佈 $[0.1, 0.1, 0.1, 0.1, 0.6]$ ，選擇概率最大的0.6，即suis。

以此類推，直到遇到<\s>標籤，得到最終的序列moi suis étudiant。

集束搜索

上面的貪心搜索只選擇了概率最大的一個，而集束搜索則選擇了概率最大的前k個。這個k值也叫做集束寬度（Beam Width）。

還是以上面的例子作爲說明，k值等於2，則集束搜索的過程如下圖：

得到第一個輸出的概率分佈 $[0.1, 0.1, 0.3, 0.4, 0.1]$ ，選擇概率最大的前兩個，0.3和0.4，即Je和moi。

然後Je和moi分別作爲Decoder的輸入，得到兩個概率分佈，然後再選擇概率和最大的前兩個序列，0.3+0.8和0.4+0.6，即Je suis和moi suis。

以此類推，最終可以得到兩個序列，即Je suis étudiant和moi suis étudiant，很明顯前者的概率和最大，爲2.2，所以這個序列是最終得到的結果。

集束搜索本質上也是貪心的思想，只不過它考慮了更多的候選搜索空間，因此可以得到更多的翻譯結果。

References

[1] https://www.tensorflow.org/tutorials/seq2seq

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

文本分類解決方法綜述(1)(2)(3)

2018-12-03 21:08:41

深度有趣 | 26 Seq2Seq機器翻譯原

2018-12-02 21:13:07

中文自然語言處理示例__LSTM with Attention Model運用於中文醫學報告預測_Part1

2018-08-22 13:11:49

seq2seq模型詳解

2018-08-22 05:55:10

tensorflow中的seq2seq的代碼詳解

2018-08-22 05:55:07

Tensorflow新版Seq2Seq接口使用

2018-08-22 00:41:16

基於LSTM的seq2seq模型介紹以及相應的改進

2018-08-21 22:31:50

Encoder-Decoder 預訓練

2018-08-21 22:31:48

tensorflow(一)：tf.contrib.seq2seq.GreedyEmbeddingHelper

2018-08-21 20:43:16

【數據應用案例】阿里巴巴長標題壓縮

2018-08-21 01:01:34

如何用TensorFlow訓練聊天機器人（附github）

超人汪小建(seaboat)

2018-08-20 19:53:32

微信小程序之藍牙 BLE 踩坑記錄微信小程序之藍牙 BLE 踩坑記錄

微信小程序之藍牙 BLE 踩坑記錄前言前段時間接手了一個微信小程序的開發，主要使用了小程序在今年 3 月開放的藍牙 API ，此過程踩坑無數，特此記錄一下跳坑過程。順便開了另一個相關的小項目，歡迎 start 和 fork： B

不及格的程序員-八神

2022-11-01 14:10:27

被鄙視做不出3D效果的一天

UI設計點兒3D效果，切圖片後給前端用，前端按照圖片做出靜態效果，結果項目上不滿意。沒錯是我太菜了，菜的一批。心裏已經燃起學習three.js的慾望。

2020-07-08 12:31:12

opencv 加載tensorflow pb模型

opencv加載的pb模型必須是用tf.layers 和 tf.nn 下的api構建的,使用slim會在加載時報未知的layer的錯誤基本流程: 1.加載pb bool CardDetect::load_model(string mo

2020-07-08 12:23:28

Redis 數據持久化方案

Redis 數據持久化方案一、持久化方案 RDB（Redis DataBase）：指定的時間間隔內保存數據快照（SNAPSHOTTING），fork出子進程，之後再由子進程完成這些持久化的工作； AOF（Append Only

2020-07-08 12:09:41

24小時熱門文章

python gdal 安裝使用（Windows， python 3.6.8）

最新文章

最新評論文章