用tensorflow構建動態RNN

原創

2019-03-29 21:06

直接看代碼

def create_cell():
    cell = rnn.LSTMCell(num_units)
    return rnn.DropoutWrapper(cell, input_keep_prob=0.5)

rnn_cell = rnn.MultiRNNCell([create_cell() for _ in range(2)])
output, states = tf.nn.dynamic_rnn(rnn_cell, x, dtype=tf.float32)

相關API：

tf.nn.dynamic_rnn(
    cell,
    inputs,
    sequence_length=None,
    initial_state=None,
    dtype=None,
    parallel_iterations=None,
    swap_memory=False,
    time_major=False,
    scope=None
)

參數

cell：一種rnn 的cell，本實例中傳入了一個多層的rnncell，每層cell的基本單元是LSTMCell，並且使用了dropout

inputs：輸入數據

如果 time_major == False (default)
input的形狀必須爲 [batch_size, max_time, embed_size]

如果 time_major == True
input輸入的形狀必須爲 [max_time, batch_size, embed_size]

其中batch_size是批大小，max_time是每個序列的大小，而embed_size是序列裏面每個分量的大小

返回的是一個元組 (outputs, state)

outputs：RNN的最後一層的輸出，是一個tensor
如果爲time_major== False，則shape [batch_size,max_time,cell.output_size]。如果爲time_major== True，則shape： [max_time,batch_size,cell.output_size]。cell.output_size就是num_units

state: RNN最後時間步的state,如果cell.state_size是一個整數(一般是單層的RNNCell)，則state的shape:[batch_size，cell.state_size]。如果它是一個元組(一般這裏是多層的RNNCell)，那麼它將是一個具有相應形狀的元組。注意：如果若RNNCell是 LSTMCells，則state將爲每層cell的LSTMStateTuple的元組Tuple(LSTMStateTuple,LSTMStateTuple,LSTMStateTuple)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

word2vec 過程理解&詞向量的獲取

網上有很多這方面的資源，詳細各位都能夠對於word2vec瞭解了大概，這裏只講講個人的理解，目的：通過對於一個神經網絡的訓練，得到每個詞對應的一個向量表達基於：這個神經網絡，是基於語言模型，即給定T個詞的字符串s，計算s

2020-07-08 10:23:34

Language Model and Recurrent Neural Networks （一）

本文是我去年十月份在公司的團隊技術分享會里面分享過的內容，分享這個內容的初衷是我發現自己對RNN(本文均指Recurrent Neural Networks而非Recursive Neural Networks)比較陌生，想找個

2020-07-08 04:31:28

Word Embeddings And Word Sense

最近在學習2019版的CS224N，把所聽到的知識做成筆記，以便自己不時地回顧這些知識，另外還希望可以方便沒有時間看課程的朋友們用來做個快速的overview（當然，親自上課是最好的選擇）。我也儘量地把所有課程的知識細節都寫出來

2020-07-08 04:31:28

##好好好好###開源的標註工具

## 開源的標註工具自然語言處理標記工具彙總 https://blog.csdn.net/wangyizhen_nju/article/details/94559607 spacy原來有兩個標註工具，displaCy-ent和displ

2020-07-08 02:12:32

[深度之眼]LeNet/AlexNet/VGGNet/InceptionNet/ResNet實現fashion_mnist分類

本文使用五種經典卷積神經網絡，實現fashion_mnist十分類問題，並對比準確度和運行時間LeNet5 原理AlexNet8 原理VGGNet16 原理InceptionNet10 原理ResNet18 原理用到的包： im

2020-07-08 11:53:37

Tensorflow常用函數（二）

tf.lin_space(start, stop, num, name=None) create a sequence of num evenly-spaced values are generated beginning at

2020-07-08 08:32:10

利用TensorBoad可視化網絡

首先寫一個最簡單的TensorFlow程序爲例。 import tensorflow as tf tf.reset_default_graph() logdir='F:/log' input1=tf.constant([

小敏偏头痛

2020-07-08 06:40:26

GPU導入模型非常緩慢的解決辦法

問題描述最近在一臺服務器上訓練模型，奈何卡有點少，爲了更有銷效率的調參，將網絡和環境都遷移到一臺8卡的服務器上，本以爲會開啓瘋狂調參模式，沒想到問題來了。GPU每秒加載4-5M的模型數據，我的模型和數據集一共差不多是8500M左

还是少年呀

2020-07-08 05:59:41

windows 下 keras.utils.plot_model報錯問題

1、下載graphviz.msi安裝包，添加Bin目錄到Path系統變量下載地址：https://graphviz.gitlab.io/_pages/Download/Download_windows.html 2、如果出現'dict'

2020-07-08 05:35:28

subprocess.py報錯：FileNotError: [Errno 2] No such file or directory: java: java

在運行coco計算ImageCaption得分時，出現以下錯誤： subprocess.py報錯：FileNotError: [Errno 2] No such file or directory: 'java': 'java' 原因：

清晨的光明

2020-07-08 02:37:26

[tensorflow2]五分鐘帶你入門tensorboard&&錯誤解決方案

好久沒有在CSDN博客寫作了，本作僅供入門使用，詳情請移步官方文檔和通常的文件讀取寫入流層一樣，tensorboard也遵循這一過程 1. 找個本子，拿起筆 train_log_dir = 'E:\\dataset\\tra

2020-07-08 02:30:48

Mac安裝Tensorflow，運行項目報錯: module compiled against API version 0xa but this version of numpy is 0x9

1、安裝Tensorflow $ sudo easy_install pip$ sudo easy_install --upgrade six$ sudo pip install tensorflow 當前最新的tensorflow版本1

2020-07-08 01:58:44

損失函數：categorical_crossentropy

損失函數：categorical_crossentropy損失函數講解合集概述正文公式分析代碼分析MORE 損失函數講解合集 binary_crossentropy categorical_crossentropy 概述本文講解

2020-07-08 01:15:40

微軟三維人臉重建論文前期知識鋪墊——《Accurate 3D Face Reconstruction with Weakly-Supervised Learning》

一個3D模型的數據結構是怎麼樣的？首先是一個points_shape,這個shape的形狀是shape=（35709，3）。其中35709代表這個模型包括35709個點，3代表的是這些點的三維座標。有了這個矩陣，我們能夠在腦海裏想象在空

2020-07-08 01:13:07

《Tensorflow中文社區教程》筆記

文|Seraph 01 | 新手入門一、介紹平面擬合代碼 import tensorflow as tf import numpy as np # 使用 NumPy 生成假數據(phony data), 總共 100 個

2020-07-08 00:56:51

24小時熱門文章

最新文章

最新評論文章