原创 Google AI dopamine 多巴胺強化學習框架

DopamineGoogle 的 github 賬戶最新發佈一個框架,叫做 Dopamine。有了 Dopamine 可以幫助大家更快地設計強化學習原型。值得試試。下圖是在 Seaquest 遊戲上的算法比對,可以看到 Rainbow 最厲

原创 使用 Ray 用 15 行 Python 代碼實現一個參數服務器

使用 Ray 用 15 行 Python 代碼實現一個參數服務器參數服務器是很多機器學習應用的核心部分。其核心作用是存放機器學習模型的參數(如,神經網絡的權重)和提供服務將參數傳給客戶端(客戶端通常是處理數據和計算參數更新的 workers