【個人心得】飛槳強化學習7日打卡營學習心得

1 課程回顧

第一次接觸強化學習能遇到飛槳的科科老師挺幸運的,在此再次感謝她和她的團隊爲了這門課程所付出的努力,她能用十分清晰簡潔的邏輯將複雜的強化學習算法講的淺顯易懂,讓我再次理解到了數學抽象的魅力,也爲我備考(考研)路上攻克數學增加了不少動力~

課程鏈接是:https://aistudio.baidu.com/aistudio/education/group/info/1335
感興趣的小夥伴可以前往查看哦,有十分詳細的錄播~

以下是我5課節的筆記分享:
Lesson1: https://blog.csdn.net/qq_41138197/article/details/106934289
Lesson2: https://blog.csdn.net/qq_41138197/article/details/106956647
Lesson3: https://blog.csdn.net/qq_41138197/article/details/106972521
Lesson4: https://blog.csdn.net/qq_41138197/article/details/106972907
Lesson5: https://blog.csdn.net/qq_41138197/article/details/106973290

2 個人收穫

2.1 paddlepaddle框架的PARL的使用

不得不說PARL的設計思路真的很棒!它將複雜的模型拆分成Model, Algorithm & Agent三部分,每個部分互相獨立,極大地降低了代碼的冗餘性、提高了代碼的複用性(例如,Algorithm可直接調用已有的)、降低了調用、維護和二次開發的學習成本。
在這裏插入圖片描述

Model: 主要用來定義網絡結構

Algorithm: 主要用來定義具體的算法

Agent: 主要負責Algorithm跟Environment的交互

Agent將獲取的數據提供給Algorithm,進而更新Model以使其做出“更好地”預測&判斷。在Model更新後,Algorithm更新輸出數據以使Agent與環境做進一步交互,進而再將獲取的新數據反饋給Algorithm,以形成完整的“優化”閉環。

2.2 Linux開發環境配置精進

在這次課程中,Linux開發環境配置這塊在不斷踩坑之後也更熟悉了,比如,本地N卡的CUDA開啓,顯卡驅動的排錯,Linux啓動黑屏修復,Python本地包編譯安裝後軟鏈接設置默認版本(當然也可以使用pyenv來管理Python版本,但是,我還是覺得自己設置軟鏈接比較高效安全一點,這個就看個人習慣了~)

2.3 分享是最高效的學習方式

在這次課程中,我也會在休息的時候擠些時間出來製作一些個人學習的成果經驗分享,比如AIStudio很多小夥伴無法使用GPU環境,其實大部分情況基本都是因爲小夥伴沒有注意pip安裝的paddlepaddle的版本(CPU還是GPU?)或者沒有將paddlepaddle升級到最新版本,如果遇到下載慢的情況可以手動更換下載的鏡像源,只需要在pip install package後面加個“-i 鏡像地址”即可,詳細可參考:https://www.bilibili.com/video/BV17t4y197wE/
此外,也碰到了一匹對此感興趣的同樣是初學者的小夥伴,私底下有時也會互相分享交流,感覺這種學習方式所帶來的成長遠比傳統課堂要高效的多,感謝這段時間遇到的飛槳的各位老師和小夥伴~

3 發展展望

人工智能的發展不僅能解放生產力以讓我們能更有效地應對人口老齡化現象,還能極大提高公共服務精準化水平,讓資源分配更加合理化,從方方面面提升我們的生活品質,隨着技術的發展將來肯定還會有更大的應用空間。
在這裏插入圖片描述飛槳的paddlepaddle框架極大地降低了瞭解人工智能的門檻,但是想要深入學習,還需要更有選擇性方向性的學習&完善,不僅是理論體系的知識,還有實際應用的業務場景,整個體系的搭建。最後,再次感謝飛槳團隊的科科老師、芮芮老師&幕後的工作人員,祝國產的paddlepaddle在人工智能這一領域越來越強!
期待你們後續的精品課程哦·~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章