目錄
- 研究課題
- Optimization
- Reinforcement Learning
- Predictive Learning, Curious Learning, Self Learning
- Unsupervised Learning
- GAN
- MCTS && AlphaGo
- 進化算法,EA
- Attention Model (待寫Blog)
- Hardware AI
- Learning Rate & 超參優化
- 鞍點,Local Minima,Generalization
- 認知、類腦計算
- 計算機視覺算法集合
- 模型壓縮
- AutoML
- Training DL
- Fast Convergence of Neural Network Training
- NLP
- ASR
- 會議idea
- 分佈式系統,非AI
研究課題
- 2018-12-24:2018年ML/AI重大進展有哪些?LeCun推薦了這篇回答
- ☆超級好的一個分類List
- 深度丨AI界的七大未解之謎:OpenAI丟出一組AI研究課題
- Olympiad Inequalities
Optimization
- 數值優化(Numerical Optimization)學習系列-目錄:蠻不錯的數值優化書的讀書筆記,推薦看。
- Numerical Optimization和Convex optimization 兩本書的選擇?
Reinforcement Learning
Predictive Learning, Curious Learning, Self Learning
-
2017.03.25:爲什麼大家都不戳破深度學習的本質?!
智能並沒有人們想象的那麼玄乎,它不過是一種「預測未來的能力」罷了。
這些預測的實質,不過是「生物的應激性」在「生物自平衡機制」&「環境壓力」下產生的副產品。
智能的核心是某種「穩定不變的東西」。而這得益於大腦皮層同質的層級結構。 -
2018-09-02: 學界 | 不設目標也能通關「馬里奧」的AI算法,全靠好奇心學習
Large-Scale Study of Curiosity-Driven Learning:
強化學習算法依賴外在於智能體的工程環境獎勵。但是,用手工設計的密集獎勵來對每個環境進行標註的方式是不可擴展的,這就需要開發智能體的內在獎勵函數。好奇心是一種利用預測誤差作爲獎勵信號的內在獎勵函數。在本文中:(a)對包括 Atari 遊戲在內的 54 個標準基準環境進行了第一次大規模的純好奇心驅動學習研究,即沒有任何外在獎勵。結果取得了驚豔的性能,並在許多遊戲環境中,內在好奇心目標函數和手工設計的外在獎勵高度一致。(b)研究了使用不同的特徵空間計算預測誤差的效果,表明隨機特徵對於許多流行的 RL 遊戲基準來說已經足夠了,但是學習特徵似乎泛化能力更強 (例如遷移到《超級馬里奧兄弟》中的新關卡)。(c)展示了隨機設置中基於預測的獎勵的侷限性。
Unsupervised Learning
GAN
- GAN Zoo,很清晰的表格√, GAN-Timeline, GAN List
- BigGAN
- ICLR2019 學界 | 史上最強GAN圖像生成器,Inception分數提高兩倍
MCTS && AlphaGo
- Chernoff-Hoeffding Bound
- A Survey of Monte Carlo Tree Search Methods, Cameron Browne et al., 2012
UCT: Bandit based Monte-Carlo Planning, Levente Kocsis et al., 2006
UCB1: Finite-time Analysis of the Multiarmed Bandit Problem, PETER AUER et al., 2002 - Introduction to Monte Carlo Tree Search;
- 蒙特卡洛樹搜索(Monte Calro Tree Search, MCTS)究竟是啥
- 知乎:蒙特卡洛樹是什麼算法?
- 高級強化學習系列 第二講 探索-利用困境(exploration-exploitation dilemma)(三)(二)(一)
- 淺述:從 Minimax 到 AlphaZero,完全信息博弈之路(1)
- UCT算法 百度百科
- 深入淺出看懂AlphaGo元::,::深入淺出看懂AlphaGo如何下棋
進化算法,EA
- TBD
Attention Model (待寫Blog)
ToRead:GNMT,Attention Is All You Need(Transformer)
-
Attention based model 是什麼,它解決了什麼問題?
在deep mind 的NIPS paper “Recurrent Models of Visual Attention ”中提出了一個非常有意思的模型。相比較於直接處理整張圖片,我們其實只需要在每一個 time step 獲取一個小patch就足夠完成某個task(比如 digit recognition)。Agent 每次只需要選取一個小patch,並且將此patch的圖片信息與location信息encode在一起,生成一個小模塊稱之爲glimpse。這個glimpse又是RNN的當前輸入,根據輸出的hidden state 可以來做object recognition,並且同時用來預測下一個patch的位置。 -
Attention Model的CV論文整理 by cosmosshadow
Hardware AI
Learning Rate & 超參優化
- [1706.00764] Hyperparameter Optimization: A Spectral Approach
- 2013 - Hinton:On the importance of initialization and momentum in deep learning
- 2017 - YellowFin and the Art of Momentum Tuning
鞍點,Local Minima,Generalization
認知、類腦計算
- 2016.5.1:《科學》封面論文作者力作:搭建像人一樣思考和學習的機器(附論文下載)
- 2016-09-25:橋接認知科學和強化學習第1部分:生成論
行動是爲了感知
Alva Noë在他書中寫的很深入,不僅僅是論述感知是爲了行動。他提出了更激進的主張,那就是行動是爲了感知。他所說的是,如果沒有行動,就沒有真正意義上對世界的體驗。這本書闡述了行動怎樣讓感知成爲可能。Noë指出,我們用眼睛所看到的圖像,僅僅提供給我們了真實世界很小一部分的信息,這些信息並不符合我們體驗世界的方式。碗在我們的視網膜上留下了橢圓形的印象。那這個橢圓的形狀是怎麼被認爲是一個碗呢?爲了回答這個問題,Noë引用了感覺運動的技巧,它可以讓我們理解真實世界相對於我們本身和環境的改變方式。這是因爲我們可以繞着碗移動,也可以轉動碗,所以我們能瞭解它是橢圓形的。通過建立感覺運動的技巧,我們可以給原本毫無意義的世界賦予相應的意義。
計算機視覺算法集合
- Re-ID LisT
- Object Detection List
- 從R-CNN到RFBNet,目標檢測架構5年演進全盤點: https://arxiv.org/abs/1809.02165
- 目標檢測算法中檢測框合併策略技術綜述:NMS算法最新進展,包括soft-NMS,softer-NMS,IoU-guided NMS,Relation Network,ConvNMS,NMS Network
- OCR技術簡介
- 開放場景文本檢測
模型壓縮
- Acceleration and Model Compression List:https://handong1587.github.io/deep_learning/2015/10/09/acceleration-model-compression.html
AutoML
- 調參工要涼?微軟重磅開源AutoML工具包NNI
- NeurIPS 2018 AutoML中國隊伍表現強勢!
- AUTOML: METHODS, SYSTEMS, CHALLENGES (NEW BOOK)
- 開源AutoKeras::Paper-Efficient Neural Architecture Search with Network Morphism,有NAS和HPO
- Papers:
Training DL
Fast Convergence of Neural Network Training
比賽:DAWNBench:An End-to-End Deep Learning Benchmark and Competition
- How Do You Find A Good Learning Rate
- The 1cycle policy,-----Cyclical LR and momentum 實驗
- Training Imagenet in 3 hours for $25; and CIFAR10 for $0.26
- AdamW and Super-convergence is now the fastest way to train neural nets,----Experiments with Adam/AdamW/amsgrad
- Now anyone can train Imagenet in 18 minutes
NLP
- 2018-6-27: 這份NLP研究進展彙總請收好,GitHub連續3天最火的都是它
- 2018-7-5: Github 上 Star 過千的 PyTorch NLP 相關項目
fairseq:https://github.com/pytorch/fairseq
ASR
- 2018-11-21:語音識別中的End-to-End模型教程
會議idea
- ICLR 2019 有什麼值得關注的亮點?
- IMAGENET-TRAINED CNNS ARE BIASED TOWARDS TEXTURE; INCREASING SHAPE BIAS IMPROVES ACCURACY AND ROBUSTNESS.
分佈式系統,非AI
- 2018-12-4:一文讀懂Corda分佈式記賬技術