原创 1. 2020年DeepMind&UCL_深度學習講座_機器學習和AI入門

1. 2020年DeepMind&UCL_深度學習講座_機器學習和AI入門 在此講座中,DeepMind研究科學家和UCL教授Thore Graepel解釋了DeepMind基於機器學習的AI方法。 他舉例說明了如何結合使用

原创 深度強化學習(資源篇)(更新於2020.06.9)

理論 ICLR2020 || 106篇深度強化學習頂會論文彙總 前沿技術 || UC Berkeley開源RAD來改進強化學習算法 加速RL探索效率,CMU、谷歌、斯坦福提出以弱監督學習解糾纏表徵 強化學習如何使用內在動機? 邊做

原创 計算機視覺 數據集(更新於2020.04.19)

Open Images V6:谷歌開放900萬註釋圖像數據集升級。首增語音、文本、鼠標軌跡同步註釋。增加1400種視覺關係註釋類型,新增2350萬個經過人工驗證的圖像級標籤,包含250萬個人類動作註釋,還更新了新特性局部敘事(lo

原创 自然語言處理 數據集(更新於2020.04.19)

自然語言處理 20 newsgroups:分類任務,將出現的單詞映射到新聞組 ID。用於文本分類的經典數據集之一,通常可用作純分類的基準或任何 IR /索引算法的驗證。 路透社新聞數據集:(較舊)純粹基於分類的數據集,包含來自新聞

原创 人工智能數據集(資源篇)(更新於2020.04.19)

收藏:全網最大機器學習數據集,視覺、NLP、音頻都在這了 280萬分割掩碼,谷歌Open Images數據集再更新 從圖像中檢測和識別表格,北航&微軟提出新型數據集TableBank 人類穿着數據集3DPeople發佈,微軟建立人

原创 AI醫療(資源篇)(更新於2020.04.26)

AI+醫學影像應用全景掃描:除自動識別病竈,還支持放射治療、手術路徑規劃等 150秒內快速診斷腦瘤!最新AI光學成像系統在《Nature Medicine》發表 吳恩達團隊最新AI醫療成果:精準預測高血壓治療效果 NeuSomat

原创 深度強化學習(資源篇)(更新於2020.04.26)

理論 除了網紅,強化學習也能帶貨? David Sliver || 2020年最新講解AlphaGo, AlphaZero and DeepRL 博士萬字總結 || 多智能體強化學習(MARL)大總結與論文詳細解讀 谷歌發佈離線強

原创 2019年伯克利大學 CS294-112《深度強化學習》第4講:強化學習簡介(筆記)

今天的課算是關於如何優化獎勵函數的強化學習算法的第一課。在接下來的幾週中會講到更多關於某個算法的細節,而今天就做一些數學推導。目的是對強化學習中一些一般的定義和不同種類的算法,有一個基本的認識。對典型的強化學習算法的原理有一個高層次

原创 2019年伯克利大學 CS294-112《深度強化學習》第3講:TensorFlow 和神經網絡簡述(筆記)

今天課的主要內容是TensorFlow的教程和深度神經網絡,由助教Greg Kahn主講。 在開始之前,想繼續講一下上週的一些討論,因爲上次最後沒有講完的所有理論,這是上星期的課程的一點尾巴。在很多場景下,模仿學習是一個學習策略的合

原创 電子(資源篇)

模擬電路 一招教你如何正確使用運算放大器的禁用引腳 教你用4路運放親手打造一個3通道混音器 電源 2019年2月“電源”主題精選乾貨大盤點! 電磁干擾 學院推薦 | EMC整改–常用小方法 文看懂EMC防護器件之TVS

原创 機器學習(問題集)

什麼是凸集、凸函數、凸學習問題? 凸集:若對集合C中任意兩點u和v,連接他們的線段仍在集合C中,那麼集合C是凸集。 公式表示爲:αu+(1-α)v∈C α∈[0, 1] 凸函數:凸集上的函數是凸函數。凸函數的每一個局部極小值也是全局極

原创 機器學習(資源篇)

理論 資源 | 如何改善你的訓練數據集?(附案例) 正則表達式教程:實例速查 關於 K means 聚類算法,你需要知道這些東西 AI/機器學習年度2018年度進展綜述 主宰這個世界的10大算法 必讀!史上引用次數最多的機器學習論文

原创 Linux 基本指令

cd指令 從 Home 去 Documents 這個文件夾 ~$ cd Documents/ ~/Documents$ 返回上一級目錄 ~/Documents$ cd .. ~$ 去往子文件夾 ~$ cd Documents

原创 深度學習(問題集)

激活函數 用來加入非線性因素的,因爲線性模型的表達力不夠。RELU函數構建稀疏矩陣,也就是稀疏性,這個特性可以去除數據中的冗餘,最大可能保留數據的特徵,也就是大多數爲0的稀疏矩陣來表示,加快計算收斂 Batch size 太大(內存,

原创 強化學習(問題集)

什麼是強化學習 強化學習是一種從行動中學習的計算方法。強化學習循環輸出state,action和reward的序列,agent的目的是最大化預計累計獎勵(expected cumulative reward) 爲什麼 Agent 的目