[RNN]tensorflow中lstm和gru的輸入輸出到底是什麼？？？

原創

zhagzheguo

2020-02-20 19:14

說出我的看法，歡迎分享，因爲我自己也不確定，，，不知道該如何解釋。。。

先貼一下我看的文章：

如何理解lstm的輸入輸出：https://www.jianshu.com/p/c66369cfa0c7

例如這樣一個數據集合，總共100條句子，每個句子20個詞，每個詞都由一個80維的向量表示。在lstm中，單個樣本即單條句子輸入下（shape是 [1 , 20, 80]），假如設定每一個time step的輸入是一個詞（當然這不一定，你也可以調成兩個詞或者更多個數的詞），則在t0時刻是第一個時間步，輸入x0則爲代表一條句子（一個樣本）中第1個詞的80維向量，t1是第二個時間步，x1表示該句子中第2個詞的80維向量，依次類推t19輸入是最後一個詞即第20個詞的向量表示。
常見的tf或者keras中lstm的參數（samples， timestep， input_dim），samples是指批量訓練樣本的數量， timestep是時間步（這個時間步可自己設置）比如上面說的20，input-dim是每個time step的輸入shape

lstm輸入輸出參數你懂了嗎：https://blog.csdn.net/ssswill/article/details/88429794
官方api：https://www.tensorflow.org/api_docs/python/tf/keras/layers/GRU?version=nightly
參數源碼：https://segmentfault.com/a/1190000020603328?utm_source=tag-newest

最後說一下自己的見解，輸入的3d爲(batch_size,time_step,input_dim)，分別爲：

 batch_size:同時輸入的一批樣本。（=1則就是隻輸入一條樣本）
 time_step:可以簡單理解爲lstm一層的單元數量。（一句話裏一個詞對應一個lstm）
 input_dim:表示一個特徵的向量維數。（表示一個詞的向量的維數）

初始化GRU時傳入的units：可以理解爲一個lstm單元中輸出的向量維數。（）
輸出的2d爲(batch_size,units),分別爲：

 batch_size:同時輸入的一批樣本。（=1則就是隻輸入一條樣本）
 units:一個lstm單元中向量維度。

我現在只能這麼理解，但是感覺還是怪怪的，期待以後的改進，，，，

來個大佬給分享一下看法哇呀呀呀呀呀

zhagzheguo

發佈了71 篇原創文章 · 獲贊 70 · 訪問量 21萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

[RNN]tensorflow中lstm和gru的輸入輸出到底是什麼？？？

linux安裝cuda和cudnn

模擬手機設備：使用 Playwright 實現移動端自動化測試

Mellanox網卡開啓SR-IOV

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

Object.values()對象遍歷

我拍了拍Redis，被移出了羣聊···

網絡現代化通向雲原生應用的高速公路

面試官：說說你對序列化的理解

我宣佈，這是我找到的史上AI最全論文體系！

CentOS使用sudo提示用戶不在sudoers文件

VS2015打開特定項目就崩潰

[jupyter]快捷鍵記錄

[jupyter]更改字體和字號

Vmvare安裝CentOS7虛擬機，並配置聯網

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結