機器學習與梯度

原創

折竹丶

2020-05-26 15:37

1、下面關於梯度消失和梯度爆炸描述正確的是？

A. 靠近output layer的hidden layer 參數更新相對正常，但靠近input layer的hidden layer 參數更新幾乎接近於初始化值

B. 靠近input layer的hidden layer 參數更新相對正常，但靠近output layer的hidden layer 參數更新幾乎接近於初始化值

C. 誤差梯度在更新中累積，變成非常大的梯度，導致網絡參數的值NAN值

D. 初始參數值過大，靠近input layer的hidden layer 參數更新比靠近output layer的hidden layer 參數更新更快，就會引起梯度爆炸

答案：A, C, D

難易程度：中

題型：多選題

2、下面關於產生梯度消失和梯度爆炸的原因描述正確的是？

A. sigmoid函數作爲激活函數,其導數最大值<1

B. tanh函數作爲激活函數,其導數也小於1

C.激活函數導數大於1，則層數增多，梯度更新以指數形式增加

D.激活函數導數小於1，則層數增多，梯度更新以指數形式衰減

答案：A, B, C, D

難易程度：中

題型：多選題

3、下面關於Model Fine-tuning缺陷描述正確的是：

A. 因爲Target data數據量少，容易出現training時性能好，testing時性能差

B. 可以通過設定最小化Target data training 的模型和Source data training 的模型的距離來規避缺陷(conservative traing)

C. 可以通過將source data training的部分中間層移花接木到Target data training 的模型中並且Target data training只training剩下沒有training過的層的參數(layer transfer)

D. 可以通過設定相同輸入數據條件下最小化Target data training 的模型輸出數據和Source data training 的模型輸出數據的二範數來規避缺陷

答案：A, B, C, D

難易程度：中

題型：多選題

4、下面爲Tomas Mikolov提出的以解決rough error surface of RNN描述正確的是：

A. 使用ReLU激活函數

B. 使用LSTM網絡

C. 使用梯度截斷

D. 預訓練加fine tunning

答案：C

難易程度：中

題型：單選題

5、{

簡述Gated Recurrent unit(GRU) 有哪兩個gate？GRU的精神/主旨是什麼？

}

{

答案：GRU由reset gate(重置門，選擇性遺忘)和update gate(更新門，選擇性記憶)組成。它的精神是放入新的值就清掉原來的值，即舊的不去新的不來，等價於RNN input門和forget門連動，若input門打開，則forget門自動關閉，洗掉memory值。

}

難易程度：中

題型：簡答題

6、下面屬於解決梯度消失的RNN的是

A. LSTM

B. GAN

C. clockwise RNN

D. structurally constrained Recurrent network(SCRN)

E. vanilla RNN

答案：A, B, C, D, E

難易程度：中

題型：多選題

7、{

簡述爲什麼LSTM可以handle梯度消失問題？

}

{

答案：LSTM與RNN相比，兩者對memory 的操作不一樣。RNN是每一個時間點memory裏的值都會被覆蓋掉，memory裏之前參數的影響就消失。LSTM memory裏的值乘以一個值再加上input值放入cell中，一旦參數影響memory，則影響會一直會存在直到forget門啓用刷新memory。

}

難易程度：中

題型：簡答題

8、下面屬於用到memory的Neural Network是？

A. RNN

B. GAN

C. LSTM

D. Attention-based model(Neural Turing Machine、Reading comprehension)

答案：A, B, C, D

難易程度：中

題型：多選題

9、下面是Deep learning integrated with structured learning？

A. semantic Tagging: Bi-directional LSTM+CRF/Structured SVM

B. GAN

C. conditional GAN

D. speech recognition: CNN/LSTM/DNN+HMM

答案：A, D

難易程度：中

題型：多選題

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

機器學習與梯度

房內有一隻猴子、一個箱子，天花板上掛了一串香荷,其位置關係如圖2 33所示，猴子爲了拿到香蕉，它必須把箱子推到香荷下面，然後再爬到箱子上.請定義必要的謂詞，寫出問題的初始狀態（即圖 2 33所示的

C++數據挖掘大作業生成數據

媲美軟件安裝管家的網站

數據挖掘（一）引論

html顯示神童詩

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結