僅展示成果:基於TORCS和Torch7實現端到端自動駕駛A3C模型的訓練

僅展示成果:基於TORCS和Torch7實現端到端自動駕駛A3C模型的訓練

博主基於TORCS和Torch7開發了基於連續動作深度強化學習模型的自動駕駛端到端仿真系統,是一個多線程異步訓練方法,每個線程更新的梯度彙總到總模型進行參數更新,接着總模型把更新後的參數分發給子線程,子線程繼續在此基礎上更新,其實就是A3C。模型輸入的是車輛前視角的圖像,也就是這個主視角的仿真界面截屏,輸出是轉角值的正態概率分佈。

博主是基於別人已有項目改的,已有項目做的是離散動作,我這裏改成了連續動作,同時修復了些隱藏的bug。而且博主用這個只是作爲驗證自己所提出的預訓練算法的仿真平臺用的,博主自己還用ROS實現了一套基於三輛真車的分佈式實車訓練系統。

因爲牽扯到自己的研究,保密需要,所以也就不公開前人的研究了。

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章