百度飛槳世界冠軍帶你從零實踐強化學習總結

強化學習個人感悟

強化學習就像是人類幾代人不斷的探索獲得一個比較好的結果的過程,類似於適者生存的過程,但是就是通過機器的學習與算法在模擬這個過程,儘可能獲得一個比較好的收益(對於機器來說)(對於我們來說是獲得一個較準確的結果),通過算法模擬獲得一個比較好的結果。

當然除了算法還有神經網絡和Q表格之類的,可以把可能出現的非連續的或連續的情況進行模擬。通過數字等模擬建模生成一個對象進行反映,反映出來的數據就是我們的訓練結果,結果好就是傳說中的人工智能,不好那就是傳說中的人工智障。

學習思路

首先是Python基礎,numpy庫、pandas庫、matplotlib庫等基礎數據處理分析庫 的掌握情況。
然後是一些數學的基礎知識,有些時候不一定懂但是一定要回用,還有基礎統計學知識。
接着是深度學習的和強化學習的理論課程,然後就是運用已有模型進行練習和學習。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章