Sequence Models-第三週

原創

2018-09-13 03:40

第三週學得有點懵懵懂懂，教學視頻已經看完了，吳恩達老師最後的總結髮言還是挺感人的（DL superman）。

1. Sequence to sequence model

從Encoder到decoder

看圖說話

2.選擇最有可能的句子

機器翻譯和傳統的語言模型很像

選擇最佳的翻譯，而不是從候選項中隨機選擇一個。

貪婪搜索法並不能保證整體的概率最大

3. Beam Search

Beam search的第一步是選擇翻譯句子的一個單詞，

第二步，分別基於每個種子首詞（B3）預測下一個單詞，留下預測概率最高的前B個選擇。

後面每一步都執行與第二步相似的操作：

因此，Beam Search實際上就是每次總選擇前三個概率最高的選擇，當B設置爲1時，Beam Search就相當於Greedy Search。

從候選翻譯句子中挑選最佳選擇時，首先應該對候選句子進行長度標準化，通常的策略是乘以一個包含長度的係數。

當把B設置的越大，越有可能找到最佳結果，然而也會導致計算量激增。

5. Error analysis in beam search

當你對模型翻譯的一個句子不夠滿意時，你需要懷疑是RNN模型的問題，還是beam search 沒找到的問題。
這時你需要比較RNN模型計算的滿意翻譯的概率 $P (y *)$ 和RNN模型計算的不滿意翻譯的概率 $P (y)$ 。

當 $P (y *) > P (y)$ 時，說明是beam search 沒有搜索到最佳翻譯。
當 $P (y *) < P (y)$ 時，說明是RNN有問題。

多找幾個實例，重複以上錯誤查找步驟，統計各種出錯的比例，以確定下一步優化方向。

6. Bleu Score

同一個句子對應多個同樣好的翻譯（答案）時，怎樣評價一個機器翻譯的準確性呢？Bleu score就是用來做這樣一件事的，簡單地說，就是查看機器翻譯的詞彙是否出現在任意一個人工翻譯的句子裏。

孤立的單詞統計意義有限，我們也可以採取統計兩個連續詞彙是否出現在標準答案裏。

事實上，人們常組合多個grams（如1-gram, 2-gram, 3-gram）共同打分。

7. Attention Model Intuition

前面我們學習的模型在做翻譯時，採用encoder到decoder的方法，然而這種方法對於翻譯較長的句子時效果往往不好。
The problem of long sequences

Attention model intuition
Attention model 在做翻譯時，會考慮附近的詞彙環境。

8. Attention Model

事實用到的attention係數需要額外建立模型去學習

9. Speech recognition

從聲音到文字

可以採用CTC的策略處理從聲音到文字過程中輸入、輸出長度不一致的問題。

10. Trigger Word Detection

採用喚醒詞喚醒語音識別系統。

注：如無特殊說明，以上所有圖片均截選自吳恩達在Coursera開設的神經網絡系列課程的講義。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

sorted 在python2和3中的區別

文章目錄sorted 在python2和3中的區別 sorted 在python2和3中的區別 python3中取消了cmp參數 python3中的使用方法如下: from functools import cmp_to_key

2020-07-08 12:31:35

monggoDB學習筆記

1、mongo是什麼關鍵詞：分佈式、可擴展、介於關係與非關係數據庫之間、文檔存儲、JSON格式存儲（可對字段建索引，實現關係數據庫的某些功能）、默認監聽端口27017 MongoDB是一個基於分佈式文件存儲的開源數據庫系統。由C++語言

2020-07-08 12:27:44

Shell編程入門（二）

多練習纔會記得牢這裏的題目來自於（個別刪選）知乎：shell編程如果當前用戶是管理員，則使用yum 安裝 vsftpd,如果不是,則提示您非管理員，不可安裝提示用戶輸入用戶名和密碼,腳本自動創建相應的賬戶及配置密碼。

存在即合理_

2020-07-08 11:22:52

在使用Django出現的疑難雜症

不知道會被笑的點讀法 Django的讀法是 [ˈdʒæŋɡo] 中文發音是迪亞戈重點是D 是輕輔音，讀出來的時候有點像是不發音。版本問題 Python3.0在 2020年是不支持 Django 3.0.4版本的。Djan

存在即合理_

2020-07-08 11:22:52

運維入門（一）

專業名詞出包：項目在執行機上運行，打包出結果，再由運維工程師轉交給開發工程師的一項活動。門禁：門禁指的是CICD的門禁，是指必要的時候進行一系列測試，以保證代碼的質量和其功能是否實現。一般由CI集成工具完成搭建與配置。門禁設

存在即合理_

2020-07-08 11:22:52

Shell編程入門（三）

簡單的Shell 命令 ll /usr/bin/java ll命令顯示詳細信息，如果java是一個目錄，顯示目錄中文件的詳細信息，如果java是一個軟連接，顯示軟連接的指向 ll ‘which java’ 顯示命令的詳細信息

存在即合理_

2020-07-08 11:22:52

Android M 新特性

六大特性： App Permission （軟件權限管理）安裝時候不會提醒權限，而是在使用時候由程序請求權限；用戶也可以在設置中對應用進行相關權限控制Chrome Custom Tags (網頁體驗提升) 登陸網站存儲密碼，自動補全資料

Jay白色风车

2020-07-08 10:03:22

學習筆記----伸展樹

最近在看伸展樹，看到了一個不錯的文章，轉載一下便於以後學習轉載地址：http://dongxicheng.org/structure/splay-tree/ 1、概述二叉查找樹（Binary Search Tree，也叫二

2020-07-08 09:04:26

mini2440開發板學習裸機開發——day1 裸機運行LED燈程序

開發背景：系統：ubuntu18.04系統開發板:mini2440 串口連接工具 J-link連接工具工具：secureCRT J-link 本次學習基於韋東山老師的嵌入式linux應用開發手冊書，結合友善之臂給出的官方資料以

2020-07-08 08:59:17

java入門程序100例學習筆記（005遞歸調用）

問題：兩年期整存零取，每月1000元，年利率1.17，問應存多少錢思路：使用遞歸調用實現：問題：局部變量的問題，變量的定義應該放在哪裏總結：遞歸要掌握好代碼下載鏈接：http://download.csdn.net/detai

2020-07-08 06:59:06

pandas數據分析讀書筆記（五）

plt.xlabel()，畫x軸標題 Plt.ylabel()，畫y軸標題 Plt.savefig(‘figpath.png’)，把圖片保存爲文件 S = pd.Series(np.random.randn(10).cumsum())

2020-07-08 06:46:51

Spring+SpringMVC+Mybatis項目中pom.xml模板

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaL

2020-07-08 06:30:02

Redis在Windows系統下安裝成服務

我們知道Redis沒有Windows系統的安裝版。Windows系統下使用Redis，每次都要打開他的redis-server.exe，並保持cmd窗口不關閉，才能正常使用。要是一不小心關掉cmd窗口，那Redis服務也關閉了。其實Re

2020-07-08 06:30:02

小程序數據請求注意事項

本文僅作爲個人學習經驗總結，如有理解有誤的地方，歡迎在評論區指出，謝謝！1.小程序的請求格式官方文檔中有明確的說明，不懂得可以看官方文檔，微信小程序開發文檔2.微信只支持https的請求方式3.文檔中要求，客戶端的 HTTPS TLS

2020-07-08 04:25:07

js原生事件封裝

自己寫的js事件的一些封裝，僅做學習筆記使用第一部分 event 添加事件，刪除事件，以及冒泡的屏蔽，並都做了兼容性的處理<span style="font-size:24px;">var event = { //添加句柄添

2020-07-08 04:25:07

24小時熱門文章

最新文章

最新評論文章