原创 LightGBM Exclusive Feature Bundling

互斥特徵合併(Exclusive Feature Bundling) 高維的數據通常是稀疏的,這種特徵空間的稀疏性給我們提供了一種設計一種接近無損地降維的可能性。特別的,在稀疏特徵空間中,許多特徵是互斥的,換句話說,大部分特徵不會同時取非

原创 論文筆記 Hierarchical Macro Strategy Model for MOBA Game AI

Hierarchical Macro Strategy Model for MOBA Game AI 自從圍棋被alpha go 解決之後,強化學習領域就把自己的注意力轉向了RTS遊戲,比如MOBA類遊戲。OPENAI 玩dota

原创 SARSA 和 Q-learning 的區別

下面這張圖截取自書上的,SARSA算法是在線算法,Q-learn是離線算法。兩者的第一步選擇動作都是epsilon-greedy,而第二部更新Q函數的時候,Q-learning 直接選擇用最優的動作a去更新Q函數,而SARSA選擇用之前的

原创 論文筆記 Cross-modal Bidirectional Translation via Reinforcement Learning

Cross-modal Bidirectional Translation via Reinforcement Learning 先說說這篇文章是做什麼的,做跨模態的翻譯,但是這裏也沒有翻譯的亞子,只是能給文本呢以及圖片選擇匹配度

原创 強化學習第九章總結,總結到9.3

這一章採取函數近似的方法,前面有提到過,狀態太多的時候會考慮把策略(存疑求證,記憶裏這裏應該是策略,但這章提的是v函數)函數pi表示成狀態的函數,只要函數的參數比狀態數要少,就能起到節省空間的作用。   簡單寫作 v_pi(s, w)

原创 強化學習第三章總結(一個簡單的總結,因爲沒時間敲公式,先放在這裏,之後慢慢收拾)

MDPs are a classical formalization of sequential decision making, where actions influence not just immediate rewards

原创 Task10 打卡 圖像分類案例2;GAN;DCGAN(1天)

圖像分類案例2;   GAN; https://zhuanlan.zhihu.com/p/33752313 DCGAN https://zhuanlan.zhihu.com/p/32298900

原创 Task 6 打卡 批量歸一化和殘差網絡;凸優化;梯度下降

關於BN 層,這篇文章講的比較清楚 https://zhuanlan.zhihu.com/p/34879333 BN層一是爲了避免神經網絡層與層之間數據的分佈差別太大,於是將特徵的分佈處理成正態分佈;但同時,不同特徵本身的差異也是數據的信

原创 Task09 打卡 目標檢測基礎;圖像風格遷移;圖像分類案例1(1天)

1 目標檢測 邊界框:生成方式是左上角右下角的座標值,顯示的時候是左上角座標和高寬(簡單的就可以由右下角座標得到) 錨框:目標檢測算法通常會在輸入圖像中採樣大量的區域,然後判斷這些區域中是否包含我們感興趣的目標,並調整區域邊緣從而更準確地

原创 POJ - 2406 Power Strings

1.題面 http://poj.org/problem?id=2406 2.題意 已知一個字符串s是由某個串t經過n重複形成的 現在給你s希望你求出n最大可以是多少 3.思路 這道題用後綴數組的倍增算法寫居然會超時,不得套了一個DC3算法

原创 POJ - 2774 Long Long Message

1.題面 http://poj.org/problem?id=2774 2.題意 給你兩個串,求兩個串中最長的公共子串,注意,不是公共子序列 3.思路 連接兩個字符串並用特殊字符分隔兩個字符串,隨後使用後綴數組,只要相鄰的兩個字符串屬於不

原创 模擬退火算法求解TSP問題

模擬退火算法求解TSP問題 1.問題 我方有一個基地,經度和緯度爲(70, 40).假設我方飛機速度爲1000km/h.我方派一架飛機從基地出發,偵查完所有目標,再返回原來的基地.再每一目標點的偵查時間不計,求該飛機所花費的最短時間. 已

原创 HDU - 3465 Life is a Line

1.題面 http://acm.hdu.edu.cn/showproblem.php?pid=3465 2.題意 給你一堆直線,求在指定區間內,這裏有多少對相交線段 3.思路 求出直線在兩個端點的值後,使用歸併排序求逆序數 PS:值得注意

原创 Matlab畫足球

轉載自:http://blog.sina.com.cn/s/blog_6f83fdb401018k9s.html 因爲要準備數模,所以要備一些Matlab的乾貨 Matlab畫足球 科普:足球表面是由12個正五邊形和20個正六邊形構成,

原创 HDU - 5861 Road

1.題面 http://acm.split.hdu.edu.cn/showproblem.php?pid=5861 2.題意 給你n個村莊,每兩個相鄰的村莊有一條路,m個操作,每次都要從一個村莊走到另外一個村莊,每一條路每次都有一個維修的