原创 強化學習之Q-learning和Sarsa

1)什麼是強化學習?   簡稱RL,理解這一概念結合現實生活中的情況不難理解。這一概念抽象出來分爲狀態,動作以及獎勵。以迷宮爲例,狀態指的是我當前所處的位置,動作指的是我可以採用何種方式進行移動,當然有的狀態中並不能包含所有的動作

原创 The greatest danger in life is an empty heart

猛然間發現自己已經好久沒有在CSDN上寫過博客了,之前的博客大部分是編譯原理課程上的作業,也沒有細緻地描述代碼思路。現在看那些已經完全沒有映象,這些作業代碼是什麼思路了。 大學畢業似乎已經逃避現實逃避了好久,看這個之前的博客包括博