LSTM一般最多堆叠多少层

在大规模翻译任务的经验中,简单的堆叠LSTM层最多可以工作4层,很少工作6层,超过8层就很差了。

Redisual connection有助于梯度的反向传播,能够帮助lstm堆叠更多层,实现更深层的训练,但是一般也就是最多到8层。

参考文献:

1.https://arxiv.org/pdf/1609.08144.pdf

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章