imagenet

原創

2020-02-21 03:04

工作找完了。。開始看論文了。。

papar: ImageNet Classification with Deep Convolutional Neural Networks 12年的一篇文章

總體結構：

一共有8層，5卷積3全連接。

一些結構上的細節：

3.1 ReLU Nonlinearity.

ReLU的引入是爲了解決梯度消失問題，同時抑制了overfitting。因爲作者用的訓練集爲imagenet，數據量還是很大的。同時還發現，ReLU能加速訓練。

3.2 Training on Multiple GPUs

一個GPU不夠，用了兩個並行的GPUs。

錯誤率分別降低1.7%和1.2%。

其實可以看到，不同的GPU，學習到的是不同的特徵。

3.3 Local Response Normalization

其中參數的值交叉驗證得到。

錯誤率分別降低1.2%與1.4%。

3.4 Overlapping Pooling

s=2，z=3.錯誤率降低0.4%。

實驗發現，overlapping pooling更不容易過擬合。

4. 抑制過擬合

4.1 Data Augmentation

a. 原圖256*256隨機取224*224。一張圖可以取2048個。

b. altering the intensities of the RGB channels in training images。

4.2 Dropout

訓練的時候，每個神經元有0.5的概率輸出爲0，這樣便沒有辦法往後與往前傳。

測試的時候，we use all the neurons but multiply their outputs by 0.5

（本結構中，全連接的第一和第二層用了dropout）

5. Details of learning

隨機梯度下降（SGD），with a batch size of 128 examples.

初始化權值均值爲0，標準差爲0.01的高斯分佈。

6. Results

參考：

1. ImageNet Classification with deep convolutional neural networks 這篇博文中對結構有更詳盡的敘述。

2. 論文筆記《ImageNet Classification with Deep Convolutional Neural Networks》細節敘述

第一次寫論文博客。。先就這樣吧。。

發佈了114 篇原創文章 · 獲贊 33 · 訪問量 9萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

LSTM用於元學習-"Learning to learn by gradient descent by gradient descent"-筆記詳解

Andrychowicz, Marcin, et al. “Learning to learn by gradient descent by gradient descent.” Advances in neural inform

2020-07-08 04:48:36

MAML模型無關的元學習方法

Notes of MAML Finn, C., Abbeel, P., & Levine, S. (2017). Model-Agnostic Meta-Learning for Fast Adaptation of Deep

2020-07-08 04:48:36

Learning to Learn without Gradient Descent by Gradient Descent論文解析（黑箱優化問題）

本篇論文屬於元學習和黑箱函數優化的交叉領域，其中將元學習的思想應用於黑箱函數優化。這篇論文發表於2017年。對於黑箱函數優化方法我瞭解的不太多，因此本文的不可避免的會有一些理解不到位的地方。想要了解貝葉斯優化和高斯過程的，可以

2020-07-08 04:10:08

Latex ulem包設置下劃線刪除線強調文本等效果

引言今天在用IEEE的模板寫latex的時候，發現了一個問題：由\begin{algorithm}方法生成的僞代碼中原本默認應該是斜體的強調部分，發現最後顯示時被自動加了下劃線。我調了十幾分鍾也沒有找到去除這些下滑線的辦法。後

2020-07-08 04:10:07

Meta-Transfer Learning for Few-Shot Learning 元遷移學習論文解讀

我之前寫過一篇元遷移學習的論文筆記，一種遷移學習和元學習的集成模型。但是本文的元遷移學習方法完全不同於上一篇論文。 Abstract 由於深度神經網絡容易對小樣本過擬合，所以元學習傾向於使用淺層神經網絡，但淺層神經網絡限制了模型

2020-07-08 04:10:07

一種遷移學習和元學習的集成模型

導言本文提出了一種將遷移學習和元學習結合在一起的訓練方法。本文是論文A Meta-Learning Approach for Custom Model Training的筆記介紹傳統上我們需要很多的訓練數據才能訓練出一個好的

2020-07-08 04:10:07

NLP中數據集的切割方法研究

NLP中數據集的切割方法研究 ACL 2019傑出論文獎: We need to talk about atandard splits 獲獎理由本文質疑了評估NLP模型性能時公認且廣泛運用的方法。本文使用詞性標註任務說明了問

2020-07-08 04:10:07

[事件知識圖譜] EventKG: A Multilingual Event-Centric Temporal Knowledge Graph

ESWC 2018 EventKG: A Multilingual Event-Centric Temporal Knowledge Graph Author Gottschalk, Simon，Demidova,

2020-07-08 00:10:09

YOWO（You Only Watch Once）論文翻譯

You Only Watch Once：Architecture for Real-Time Spatiotemporal Action Localization 論文地址 Github地址摘要時空動作定位要求將兩個信息源整合

2020-07-07 23:39:37

綜述：PBFT, Paxos, RAFT

綜述：PBFT, Paxos, RAFTPBFTRaftPaxos總結 PBFT 共識算法的集羣中有很多節點，它們都可以處理客戶發來的請求，但是客戶發送請求的順序對於最終的結果存在很大的影響。因此，爲了統一這個結果的順序，PBFT

2020-07-07 00:15:05

[事件知識圖譜] Building event-centric knowledge graphs from news

Journal of Web Semantics(2016) Building event-centric knowledge graphs from news Author Marco Rospocher, Mar

2020-07-06 23:40:29

Latex 引用、索引不跳轉的問題

解決Latex 引用、索引不跳轉的問題使用Latex編輯文章，發現生成的pdf文檔的引用、索引不響應鼠標事件，也就是不跳轉。解決方法按原先的Latex->BibTex->Latex->Latex編譯，完成後不要直接點擊dv

2020-07-06 20:49:41

論文筆記之Fully Convolutional Networks for Semantic Segmentation

最近了解到了Image Semantic Segmentation方面的知識，在此做一個記錄。這篇論文是2015cvpr的best paper，可以說是在cnn上做圖像語義分割的開山之作。 1.語義分割定義：語義就是指物體的

2020-07-08 10:23:34

MNIST數據集手寫數字識別

pytorch的MNIST數據集手寫數字識別(GPU) 數據集介紹 MNIST 包括6萬張28x28的訓練樣本，1萬張測試樣本，很多教程都會對它”下手”幾乎成爲一個 “典範”，可以說它就是計算機視覺裏面的Hello World。所

2020-07-08 05:29:48

【論文筆記】Convolutional Neural Networks for Sentence Classification

paper鏈接 https://arxiv.org/abs/1408.5882 閱讀這篇paper的一些筆記： Abstract 本文將CNN和NLP結合；介紹了一系列的對比實驗，實驗結果說明了：一個簡單的（單層神經網絡

2020-07-06 18:40:30

24小時熱門文章

最新文章

最新評論文章