元學習gradient descent as LSTM（2）--李宏毅老師課程學習筆記

原創

2020-06-16 14:38

我們發現meta learning中的結構與RNN比較相似，具體看下面兩篇論文是講這個的。

RNN是用同一個單元去處理很長的句子，因爲每次只吃一個單詞。

現在基本用LSTM，通過結構發現Ct的特殊，同時由於它改變較慢，因此LSTM能夠儲存較長之間之前的詞。

複習一下LSTM：

這個圖和上面的圖進行對比，是LSTM的簡化版。

如果把sita t-1 的loss用來更新zi，那麼可以多樣地調整學習率。

實際的時候，一個LSTM用在所有的參數中。

以前的方法都會用以前的梯度，那我們是不是也能這樣。下面的結構在論文中是沒有的，在learning to learn by gradient descent by gradient descent論文中，有下面的關於保留之前梯度的內容，但是在sita的時候，只是簡單地做了一下更新。

下面看一下實驗結果，看下圖中，因爲minist數據集的話，做meta learning 意義不大。因此train 20個unit test 40個unit 的對比，以及test 2 layer 的對比，效果都很好。但是當train 是sigmoid ,test是relu函數時，效果就差了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Linkage Based Face Clustering via Graph Convolution Network

Linkage Based Face Clustering via Graph Convolution Network 本文使用圖卷積做基於邊預測的臉聚類，如果兩個點屬於同一類，那麼這兩個點之間就會有一條邊連接，最後找出所有的圖即

2020-07-02 09:14:20

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs 考慮零樣本的識別問題，在沒有訓練樣本的情況下對某個類別學習一個分類器，僅僅使用該類別的詞向量和其

2020-07-02 09:14:19

關於MAML的那些事

多餘的元學習廢話也不多說，直接上乾貨：算法：關於學習率：兩個學習率a、b，要知道，爲了一步優化探測task最優參數的位置（inner loop），我們必須使用稍微大點的學習率a，這叫一步到位。而優化你真正模型參數的學習率

2020-07-01 05:20:41

Reptile原理以及代碼詳解

論文：2018-On First-Order Meta-Learning Algorithms 算法簡介 MAML,FOMAML,reptile這些都是關於fewshot任務中參數初始化的問題，這些算法都是尋找一個模型合理的初始化

2020-07-01 05:20:41

元學習MAML reptile（1）-李宏毅老師課程學習筆記

meta learn =learn to learn 我們希望機器學習怎樣去學習這件事情，就是學會語音辨識、圖像辨識以後，它學會了如何去學習學習這件事情，而不是停留在語音和圖像的任務上。就是我們不需要自己去定義網絡的結構以及訓

2020-06-16 14:38:18

元學習（3）--李宏毅老師課程學習筆記

有沒有什麼模型，它可以直接輸train data 和test data,輸出是不是，全部封裝好。其實我們手機上的人臉識別就是這樣的。 siamese network --孿生網絡，兩個網絡的參數可以共享也可以不共享。

2020-06-16 14:38:17

Reptile:On First-Order Meta-Learning Algorithms

2020-05-31 23:32:28

A SIMPLE NEURAL ATTENTIVE META-LEARNER

2020-05-31 23:32:28

神經網絡中的元學習研究

神經網絡中的元學習研究 Meta learning（Learning to learn）在近幾年的研究中受到了越來越多的關注。Meta learning的目標旨在改善學習算法本身，讓模型更精通學習。基於深度學習的方法在各個領域都取

2020-07-05 07:51:32

Linkage Based Face Clustering via Graph Convolution Network

Linkage Based Face Clustering via Graph Convolution Network 本文使用圖卷積做基於邊預測的臉聚類，如果兩個點屬於同一類，那麼這兩個點之間就會有一條邊連接，最後找出所有的圖即

2020-07-02 09:14:20

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs

Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs 考慮零樣本的識別問題，在沒有訓練樣本的情況下對某個類別學習一個分類器，僅僅使用該類別的詞向量和其

2020-07-02 09:14:19

關於MAML的那些事

多餘的元學習廢話也不多說，直接上乾貨：算法：關於學習率：兩個學習率a、b，要知道，爲了一步優化探測task最優參數的位置（inner loop），我們必須使用稍微大點的學習率a，這叫一步到位。而優化你真正模型參數的學習率

2020-07-01 05:20:41

Reptile原理以及代碼詳解

論文：2018-On First-Order Meta-Learning Algorithms 算法簡介 MAML,FOMAML,reptile這些都是關於fewshot任務中參數初始化的問題，這些算法都是尋找一個模型合理的初始化

2020-07-01 05:20:41

Meta Learning資源學習列表

Meta-learning（元學習）是機器學習社區中解決學會學習問題的令人興奮的研究趨勢。機器學習研究的傳統範例是獲取特定任務的龐大數據集，並使用該數據集從頭開始訓練模型。顯然，這與人類利用過去的經驗，僅從少量示例中快速學習新任

半月夏微凉

2020-06-29 19:29:33

Meta Learning論文與方法總結

Meta Learning Machine learning可以理解爲根據數據找一個函數f的能力，Machine Learning通過訓練數據讓模型能夠學習到某種抽象的規律或概念，而Meta Learning可以理解爲根據數據找一

2020-06-23 21:07:19

24小時熱門文章

最新文章

最新評論文章