算法轉載收藏【2018年及之前】

研究課題

Optimization

數值優化（Numerical Optimization）學習系列-目錄：蠻不錯的數值優化書的讀書筆記，推薦看。
Numerical Optimization和Convex optimization 兩本書的選擇?

Reinforcement Learning

RL List

Predictive Learning， Curious Learning， Self Learning

2017.03.25：爲什麼大家都不戳破深度學習的本質？！
智能並沒有人們想象的那麼玄乎，它不過是一種「預測未來的能力」罷了。
這些預測的實質，不過是「生物的應激性」在「生物自平衡機制」&「環境壓力」下產生的副產品。
智能的核心是某種「穩定不變的東西」。而這得益於大腦皮層同質的層級結構。
2018-09-02: 學界 | 不設目標也能通關「馬里奧」的AI算法，全靠好奇心學習
Large-Scale Study of Curiosity-Driven Learning:
強化學習算法依賴外在於智能體的工程環境獎勵。但是，用手工設計的密集獎勵來對每個環境進行標註的方式是不可擴展的，這就需要開發智能體的內在獎勵函數。好奇心是一種利用預測誤差作爲獎勵信號的內在獎勵函數。在本文中：（a）對包括 Atari 遊戲在內的 54 個標準基準環境進行了第一次大規模的純好奇心驅動學習研究，即沒有任何外在獎勵。結果取得了驚豔的性能，並在許多遊戲環境中，內在好奇心目標函數和手工設計的外在獎勵高度一致。（b）研究了使用不同的特徵空間計算預測誤差的效果，表明隨機特徵對於許多流行的 RL 遊戲基準來說已經足夠了，但是學習特徵似乎泛化能力更強 (例如遷移到《超級馬里奧兄弟》中的新關卡)。（c）展示了隨機設置中基於預測的獎勵的侷限性。

Unsupervised Learning

Unsuperiised Learning List

GAN

GAN Zoo，很清晰的表格√， GAN-Timeline， GAN List
BigGAN
ICLR2019 學界 | 史上最強GAN圖像生成器，Inception分數提高兩倍

MCTS && AlphaGo

Chernoff-Hoeffding Bound
A Survey of Monte Carlo Tree Search Methods, Cameron Browne et al., 2012
UCT: Bandit based Monte-Carlo Planning, Levente Kocsis et al., 2006
UCB1: Finite-time Analysis of the Multiarmed Bandit Problem, PETER AUER et al., 2002
Introduction to Monte Carlo Tree Search；
蒙特卡洛樹搜索(Monte Calro Tree Search, MCTS)究竟是啥
知乎：蒙特卡洛樹是什麼算法？
高級強化學習系列第二講探索-利用困境（exploration-exploitation dilemma）（三）（二）（一）
淺述：從 Minimax 到 AlphaZero，完全信息博弈之路（1）
UCT算法百度百科
深入淺出看懂AlphaGo元：：，：：深入淺出看懂AlphaGo如何下棋

進化算法，EA

Attention Model （待寫Blog）

ToRead：GNMT，Attention Is All You Need（Transformer）

Attention based model 是什麼，它解決了什麼問題？

在deep mind 的NIPS paper “Recurrent Models of Visual Attention ”中提出了一個非常有意思的模型。相比較於直接處理整張圖片，我們其實只需要在每一個 time step 獲取一個小patch就足夠完成某個task(比如 digit recognition)。Agent 每次只需要選取一個小patch,並且將此patch的圖片信息與location信息encode在一起，生成一個小模塊稱之爲glimpse。這個glimpse又是RNN的當前輸入，根據輸出的hidden state 可以來做object recognition，並且同時用來預測下一個patch的位置。
Attention Model的CV論文整理 by cosmosshadow

Hardware AI

從ISCA論文看AI硬件加速的新技巧

Learning Rate & 超參優化

[1706.00764] Hyperparameter Optimization: A Spectral Approach
2013 - Hinton：On the importance of initialization and momentum in deep learning
2017 - YellowFin and the Art of Momentum Tuning

鞍點，Local Minima，Generalization

Michael I. Jordan： Accelerated Gradient Descent Escapes Saddle Points Faster than Gradient Descent

認知、類腦計算

2016.5.1：《科學》封面論文作者力作：搭建像人一樣思考和學習的機器（附論文下載）
2016-09-25：橋接認知科學和強化學習第1部分：生成論
行動是爲了感知
Alva Noë在他書中寫的很深入，不僅僅是論述感知是爲了行動。他提出了更激進的主張，那就是行動是爲了感知。他所說的是，如果沒有行動，就沒有真正意義上對世界的體驗。這本書闡述了行動怎樣讓感知成爲可能。Noë指出，我們用眼睛所看到的圖像，僅僅提供給我們了真實世界很小一部分的信息，這些信息並不符合我們體驗世界的方式。碗在我們的視網膜上留下了橢圓形的印象。那這個橢圓的形狀是怎麼被認爲是一個碗呢？爲了回答這個問題，Noë引用了感覺運動的技巧，它可以讓我們理解真實世界相對於我們本身和環境的改變方式。這是因爲我們可以繞着碗移動，也可以轉動碗，所以我們能瞭解它是橢圓形的。通過建立感覺運動的技巧，我們可以給原本毫無意義的世界賦予相應的意義。

計算機視覺算法集合

Re-ID LisT
Object Detection List
從R-CNN到RFBNet，目標檢測架構5年演進全盤點： https://arxiv.org/abs/1809.02165
目標檢測算法中檢測框合併策略技術綜述：NMS算法最新進展，包括soft-NMS，softer-NMS，IoU-guided NMS，Relation Network，ConvNMS，NMS Network
OCR技術簡介
開放場景文本檢測
- 曠視科技提出SPCNet：一種任意形狀的場景文本檢測算法
- 曠視科技提出TextSnake：一個檢測任意形狀文本的靈活表徵

模型壓縮

Acceleration and Model Compression List：https://handong1587.github.io/deep_learning/2015/10/09/acceleration-model-compression.html

AutoML

調參工要涼？微軟重磅開源AutoML工具包NNI
NeurIPS 2018 AutoML中國隊伍表現強勢！
AUTOML: METHODS, SYSTEMS, CHALLENGES (NEW BOOK)
開源AutoKeras：：Paper-Efficient Neural Architecture Search with Network Morphism，有NAS和HPO
Papers:
- ICLR19 - DARTS: DIFFERENTIABLE ARCHITECTURE SEARCH
- ICLR19 - You Only Search Once: Single Shot Neural Architecture Search via Direct Sparse Optimization:中科院&圖森提出通過稀疏優化進行一次神經架構搜索

Training DL

Fast Convergence of Neural Network Training

比賽：DAWNBench：An End-to-End Deep Learning Benchmark and Competition

NLP

2018-6-27：這份NLP研究進展彙總請收好，GitHub連續3天最火的都是它
2018-7-5： Github 上 Star 過千的 PyTorch NLP 相關項目
fairseq：https://github.com/pytorch/fairseq

ASR

2018-11-21：語音識別中的End-to-End模型教程

會議idea

ICLR 2019 有什麼值得關注的亮點？
IMAGENET-TRAINED CNNS ARE BIASED TOWARDS TEXTURE; INCREASING SHAPE BIAS IMPROVES ACCURACY AND ROBUSTNESS.

分佈式系統，非AI

2018-12-4：一文讀懂Corda分佈式記賬技術

算法轉載收藏【2018年及之前】

目錄

研究課題

Optimization

Reinforcement Learning

Predictive Learning， Curious Learning， Self Learning

Unsupervised Learning

GAN

MCTS && AlphaGo

進化算法，EA

Attention Model （待寫Blog）

Hardware AI

Learning Rate & 超參優化

鞍點，Local Minima，Generalization

認知、類腦計算

計算機視覺算法集合

模型壓縮

AutoML

Training DL

Fast Convergence of Neural Network Training

NLP

ASR

會議idea

分佈式系統，非AI

人工智能新聞/資料/文章收錄【2018年及之前】

算法轉載收藏【2018年及之前】

今天開始學Convex Optimization：引言、第1章基本概念介紹

入門神經網絡優化算法（一）：Gradient Descent，Momentum，Nesterov accelerated gradient

深度學習/機器學習入門基礎數學知識整理（四）：擬牛頓法、BFGS、L-BFGS、DFP、共軛梯度法

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結