原创 計算機視覺CV 之 CMT跟蹤算法分析3

1 前言 在上一篇blog中,我們分析了CMT的整體算法流程及前面幾步的實現分析,接下來我們繼續分析後面的幾步。 2 Step 4,5,6 特徵點匹配與數據融合 這幾步就是通過跟蹤和特徵匹配來獲取這一幀的特徵點,將兩者融合在一起。

原创 Python 學習之一:在Mac OS X下基於Sublime Text搭建開發平臺包含numpy,scipy

1 前言 Python有很多IDE可以用,官方自己也帶了一個,Eclipse也可以。但我在使用各種IDE之後,發現用Sublime Text是最好用的一個。因此,我都是用Sublime Text來編寫Python程序。 那麼整個

原创 Python 學習之三:NumPy,SciPy,Matplotlib教程

轉自:http://cs231n.github.io/python-numpy-tutorial/ Numpy Numpy is the core library for scientific computing in Pytho

原创 增強學習Reinforcement Learning經典算法梳理3:TD方法

1 前言 在上一篇blog中,我們分析了蒙特卡洛方法,這個方法的一個特點就是需要運行完整個episode從而獲得準確的result。但是往往很多場景下要運行完整個episode是很費時間的,因此,能不能還是沿着bellman方程的路子,估

原创 增強學習Reinforcement Learning經典算法梳理1:policy and value iteration

前言 就目前來看,深度增強學習(Deep Reinforcement Learning)中的很多方法都是基於以前的增強學習算法,將其中的value function價值函數或者Policy function策略函數用深度神經網絡替代而實現

原创 DRL前沿之:Hierarchical Deep Reinforcement Learning

1 前言 如果大家已經對DQN有所瞭解,那麼大家就會知道,DeepMind測試的40多款遊戲中,有那麼幾款遊戲無論怎麼訓練,結果都是0的遊戲,也就是DQN完全無效的遊戲,有什麼遊戲呢? 比如上圖這款遊戲,叫做Montezuma’s

原创 AlphaGo來了,終結者不遠了

人工智能真的來了 其實我就只想跟大家說這句話! 即使AlphaGo完勝李世石這件事已經發生,很多人仍然保持着懷疑的態度,這裏面也包含着很多人工智能的研究人員。人類在面對新的認知的時候大概都會是這樣的表現吧! 很多人依然覺得強人工智能(A

原创 瞭解點OpenAI及深度學習研究前沿

前言 OpenAI是2015年底剛成立的人工智能公司,由Elon Musk領投,號稱有10億美金的投資額,由幾位人工智能的頂尖好手組成。這基本上意味着一個新的DeepMind公司誕生,只不過這次OpenAI是一個組織,不屬於任何一個公司。

原创 深度增強學習 知乎專欄與Blog遷移說明

由於知乎專欄的簡潔明瞭的界面,本人已入駐知乎專欄 智能單元 https://zhuanlan.zhihu.com/intelligentunit 我將在這裏分享深度增強學習相關的入門級精華教程,以及最前沿論文的分析(部分內容會以當前

原创 瞭解點Jurgen Schmidbuber

前言 可能很多童鞋都知道Andrew Ng,但並不是很多人知道Jurgen Schmidbuber。但在我看來,這位大神真的的超神。由於RNN,LSTM的興起,Jurgen Schmidbuber開始走入到我們的視線。深入瞭解一下,發

原创 增強學習Reinforcement Learning經典算法梳理2:蒙特卡洛方法

1 前言 在上一篇文章中,我們介紹了基於Bellman方程而得到的Policy Iteration和Value Iteration兩種基本的算法,但是這兩種算法實際上很難直接應用,原因在於依然是偏於理想化的兩個算法,需要知道狀態轉移概率,

原创 DRL前沿之:End to End Learning for Self-Driving Cars

前言 如果大家關注上個月Nvidia GTC,那麼大家應該會注意到Nvidia 老大黃仁勳介紹了他們自家的無人駕駛汽車,這個汽車的無人駕駛技術和以往的方法不一樣,完全採用神經網絡。這個系統取名爲DAVE。 NVIDIA GTC Self

原创 Paper Reading 4:Massively Parallel Methods for Deep Reinforcement Learning

來源:ICML 2015 Deep Learning Workshop 作者:Google DeepMind 創新點:構建第一個用於深度增強學習的大規模分佈式結構 該結構由四部分組成: 並行的行動器:用於產生新的行爲 並行的學習器:用於

原创 從頭開始安裝Ubuntu,cuda,cudnn,caffe,tensorflow,ROS

前言 安裝ubuntu一直是一件特別特別麻煩的事情,以前常常因爲換一臺主機就得完全重新安裝一遍,每次安裝都要折騰特別久,總會遇到各種各樣的問題。因此很有必要寫一個Blog完整記錄整個過程及遇到的問題。 現在,我使用Thinkpad e4

原创 你是這樣獲取人工智能AI前沿信息的嗎?

前言 對於Researchers或者Geeks而言,特別是並沒有在頂級的科研圈裏的人,如何高效的獲取最新的科技前沿,對自己的研究方向,定位是非常重要的。對於比如人工智能的入門者而言,確定方向更是重中之重。本人自己的經歷發現常常相對旁人總能