DQN(Deep Q-learning)入門教程(結束)之總結

emm,花了一週時間完成了DQN的從入門到入土,這個系列是完完全全的入門系列,因爲講的內容很簡單,內容也比較少,僅僅是一個最基本的介紹。

我也是因爲偶然的原因才接觸到強化學習,然後覺得很有意思,比較好奇它是怎麼做到的,於是就花了一段時間去了解,接着就將自己的入門過程就寫下來了。

這個系列相比較與數據挖掘系列的博客,內容還是比較少的,內容如下所示:

  1. DQN(Deep Q-learning)入門教程(零)之教程介紹
  2. DQN(Deep Q-learning)入門教程(一)之強化學習介紹
  3. DQN(Deep Q-learning)入門教程(二)之最優選擇
  4. DQN(Deep Q-learning)入門教程(三)之蒙特卡羅法算法與Q-learning算法
  5. DQN(Deep Q-learning)入門教程(四)之Q-learning Play Flappy Bird
  6. DQN(Deep Q-learning)入門教程(五)之DQN介紹
  7. DQN(Deep Q-learning)入門教程(六)之DQN Play Flappy-bird ,MountainCar

說實話,以6篇博客想來學懂DQN(或者強化學習)是遠遠不夠的,一來,篇幅不夠;二來,自己的水平也不夠。我僅僅是個初學者,又怎麼可能有能力將其講得廣闊而透徹呢?因此,這個系列也僅僅是一個入門系列,最基本的入門。

不過,如果我們對某一個東西有興趣的話,學習起來也就會事倍功半。它能夠站在後面驅使着我們去學習。在個人看來,機器學習本身就是一個好玩的東西(儘管掉了一堆頭髮,是真的一堆頭髮,我媽打掃房間的時候還吐槽我怎麼掉了這麼多頭髮,/(ㄒoㄒ)/~~),如何進行加快模型的收斂,如何提取有用的信息,如何構建一個好的模型,這些都是值得研究,並且很有意思的東西。我還依稀的記得,當我瞭解到神經網絡總的MP模型的時候,我直接驚呆了,爲模型之簡介感到驚歎。

這個系列的博客實際上我是寫的匆匆忙忙,只花了約一週的時間就寫完了。實際上如果我時間很多的話,至少這個系列的博客不會低於15篇,但是,說實話我不敢這樣去寫。因爲我需要考研了,如果寫15篇的話,那至少得需要近2個月的時間,這樣勢必會耽誤我的複習,因此也只能這樣了。如果我考研能夠成功上岸的話,那麼我將會更加深入地去了解強化學習以及其優化方法,畢竟那時候時間應該會挺多的。總的來說,還是比較遺憾,無法將這個系列深入學習和寫下去。

接下來一段時間,如果沒有特殊情況,我基本不會再去寫博客,也不會對博客進行更新,如果大家想更加深入的去了解強學習,推薦大家可以去看看:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章