元学习gradient descent as LSTM（2）--李宏毅老师课程学习笔记

原創

2020-06-16 14:38

我们发现meta learning中的结构与RNN比较相似，具体看下面两篇论文是讲这个的。

RNN是用同一个单元去处理很长的句子，因为每次只吃一个单词。

现在基本用LSTM，通过结构发现Ct的特殊，同时由于它改变较慢，因此LSTM能够储存较长之间之前的词。

复习一下LSTM：

这个图和上面的图进行对比，是LSTM的简化版。

如果把sita t-1 的loss用来更新zi，那么可以多样地调整学习率。

实际的时候，一个LSTM用在所有的参数中。

以前的方法都会用以前的梯度，那我们是不是也能这样。下面的结构在论文中是没有的，在learning to learn by gradient descent by gradient descent论文中，有下面的关于保留之前梯度的内容，但是在sita的时候，只是简单地做了一下更新。

下面看一下实验结果，看下图中，因为minist数据集的话，做meta learning 意义不大。因此train 20个unit test 40个unit 的对比，以及test 2 layer 的对比，效果都很好。但是当train 是sigmoid ,test是relu函数时，效果就差了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Linkage Based Face Clustering via Graph Convolution Network

Linkage Based Face Clustering via Graph Convolution Network 本文使用圖卷積做基於邊預測的臉聚類，如果兩個點屬於同一類，那麼這兩個點之間就會有一條邊連接，最後找出所有的圖即

2020-07-02 09:14:20

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs 考慮零樣本的識別問題，在沒有訓練樣本的情況下對某個類別學習一個分類器，僅僅使用該類別的詞向量和其

2020-07-02 09:14:19

关于MAML的那些事

多餘的元學習廢話也不多說，直接上乾貨：算法：關於學習率：兩個學習率a、b，要知道，爲了一步優化探測task最優參數的位置（inner loop），我們必須使用稍微大點的學習率a，這叫一步到位。而優化你真正模型參數的學習率

2020-07-01 05:20:41

Reptile原理以及代码详解

論文：2018-On First-Order Meta-Learning Algorithms 算法簡介 MAML,FOMAML,reptile這些都是關於fewshot任務中參數初始化的問題，這些算法都是尋找一個模型合理的初始化

2020-07-01 05:20:41

元学习MAML reptile（1）-李宏毅老师课程学习笔记

meta learn =learn to learn 我們希望機器學習怎樣去學習這件事情，就是學會語音辨識、圖像辨識以後，它學會了如何去學習學習這件事情，而不是停留在語音和圖像的任務上。就是我們不需要自己去定義網絡的結構以及訓

2020-06-16 14:38:18

元学习（3）--李宏毅老师课程学习笔记

有沒有什麼模型，它可以直接輸train data 和test data,輸出是不是，全部封裝好。其實我們手機上的人臉識別就是這樣的。 siamese network --孿生網絡，兩個網絡的參數可以共享也可以不共享。

2020-06-16 14:38:17

Reptile:On First-Order Meta-Learning Algorithms

2020-05-31 23:32:28

A SIMPLE NEURAL ATTENTIVE META-LEARNER

2020-05-31 23:32:28

神经网络中的元学习研究

神經網絡中的元學習研究 Meta learning（Learning to learn）在近幾年的研究中受到了越來越多的關注。Meta learning的目標旨在改善學習算法本身，讓模型更精通學習。基於深度學習的方法在各個領域都取

2020-07-05 07:51:32

Linkage Based Face Clustering via Graph Convolution Network

Linkage Based Face Clustering via Graph Convolution Network 本文使用圖卷積做基於邊預測的臉聚類，如果兩個點屬於同一類，那麼這兩個點之間就會有一條邊連接，最後找出所有的圖即

2020-07-02 09:14:20

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs 考慮零樣本的識別問題，在沒有訓練樣本的情況下對某個類別學習一個分類器，僅僅使用該類別的詞向量和其

2020-07-02 09:14:19

关于MAML的那些事

多餘的元學習廢話也不多說，直接上乾貨：算法：關於學習率：兩個學習率a、b，要知道，爲了一步優化探測task最優參數的位置（inner loop），我們必須使用稍微大點的學習率a，這叫一步到位。而優化你真正模型參數的學習率

2020-07-01 05:20:41

Reptile原理以及代码详解

論文：2018-On First-Order Meta-Learning Algorithms 算法簡介 MAML,FOMAML,reptile這些都是關於fewshot任務中參數初始化的問題，這些算法都是尋找一個模型合理的初始化

2020-07-01 05:20:41

Meta Learning资源学习列表

Meta-learning（元學習）是機器學習社區中解決學會學習問題的令人興奮的研究趨勢。機器學習研究的傳統範例是獲取特定任務的龐大數據集，並使用該數據集從頭開始訓練模型。顯然，這與人類利用過去的經驗，僅從少量示例中快速學習新任

半月夏微凉

2020-06-29 19:29:33

Meta Learning论文与方法总结

Meta Learning Machine learning可以理解爲根據數據找一個函數f的能力，Machine Learning通過訓練數據讓模型能夠學習到某種抽象的規律或概念，而Meta Learning可以理解爲根據數據找一

2020-06-23 21:07:19

24小時熱門文章

最新文章

最新評論文章