上海復旦大學吳立德教授深度學習課程一

原創

2020-06-07 22:32

簡介

DL是ML的分支，DL的框架與ML框架的一部分。

ML框架

數據 D

$D = {x i, y i | 1 \leq i \leq m}$
xi 是監督學習的訓練數據輸入，yi 輸入訓練數據對應的輸出.

模型 M

F={f(x;θ),θ∈Θ}

線性模型：y=f(x)=ωTx+b

廣義線性模型：y=f(x)=ωTϕ(x)+b

非線性模型：ANN - - -DL模型

準則 C

損失函數 L(y,f(x))

經驗風險R(θ)=1m∑mi=1L(yi,f(xi,θ))

正則項：||ω||2

目標函數： minR(θ)+λ||ω||2

線性模型和廣義線性模型

對於一部分數據來說，本身就是稀疏的，可以通過線性模型直接優化求解的模型，有很大一部分數據本身不是稀疏度，不可以通過線性模型直接求解，但是此類數據在其他域如小波域，DCT域等可以稀疏表示，從而通過線性模型進行優化求解。

ANN簡介

神經元

y=f(∑iwiai+bi)

神經層
多個神經元組成神經層。

神經網

全參數ANN問題

可訓練參數太多
1. 計算資源要大需要海量的CPU來玩這個算法。
2. 數據量充足數據量小，參數多，過擬合的問題就嚴重了。
3. 算法效率要高茫茫大海中如何去尋找那組最優的參數需要高效的進行。
4. 解釋困難雖然模型取得效果，但是很難直觀解釋爲什麼模型會work。
5. 當神經網絡層數增多時問題變爲非凸優化問題，引入局部極值問題。
6. 具有梯度彌散問題，當層數增多時會出現過擬合問題。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

caffe中增加自己的layer

假設新增加的層命名爲：NEW 1. 在src/proto的LayerParameter 的 LayerType下加 NEW= 數字； 2. 在src/layer_factory.cpp中，加 case LayerParam

2020-07-07 08:02:37

Fast RCNN ubuntu下安裝筆記

微軟研究院大神Ross Girshick新作：fase CNN，測試速度比RCNN快200倍。文章：http://arxiv.org/pdf/1504.08083v1.pdf 代碼：https://github.com/rbgirshi

2020-07-07 08:02:37

python深度學習---生成式對抗網絡（GAN）

生成式對抗網絡（GAN，generative adversarial network）由 Goodfellow 等人於 2014 年提出，它可以替代VAE來學習圖像的潛在空間。 ''' # 它能夠迫使生成圖像與真實圖像在統計上幾乎無

2020-07-06 21:30:11

深度學習設計

損失函數設計： 1、目標檢測領域：不提倡使用預測框座標與GT座標的差值進行損失函數統計，因爲座標差值會受座標尺寸大小影響，座標尺寸大的時候，差值相對大，座標尺寸小，差值相對小。改進：使用IOU，IOU不受座標尺寸因素的影響。（兩種座

2020-07-06 19:28:01

cuda error

1. 問題描述想把從圖像手工生成的特徵和經過backbone提取的特徵concatenate起來再進入網絡後面的層： x_added_coord = torch.cat([x_backbone, x_coord], 1) 報錯： Ru

2020-07-05 20:39:46

pytorch Dataloader 速度慢

1. 問題描述 Dataloader每讀完一個batch中間會間隔2s左右，很浪費時間，而且確定不是由於Dataset的__getitem__()複雜導致的。並且有一個規律，如果設置num_works=4，會出現4個batch一批很快，然

2020-07-05 20:39:35

深度學習基本術語

1、關於一個事件或對象的描述，稱爲一個“示例”（instance）或“樣本”（sample），“示例”或“樣本”的集合稱爲一個“數據集”（data set）。例如，（色澤=青綠；根蒂=蜷縮；敲聲=濁響），（色澤=烏黑；根蒂=

2020-07-05 06:12:43

Deep Learning科普

首先，要由人工智能之父圖靈說起。圖靈曾經有個夢想卸載《計算機器與智能》（1950）一文中，如果有一天，計算機能夠做到，隔着牆，你根本分不清對面和你交流是一個人還是計算機，那麼這臺計算機就具有了人工智能。接下來的半個世紀裏

生命不止coding不息

2020-07-04 20:52:07

理解CNN神經網絡

首先構建好用於學習的模型，也就是各個層用什麼激活函數、輸出層的如softmax函數、各層神經元的個數、損失函數等等。然後使用訓練數據集來不斷的調整模型的參數（學習）。具體怎麼做的？首先設定一個初始參數。然後開始學習，計

2020-07-04 12:09:04

What is Back Propaganda？

反向傳播用來計算導數，但這個不是反向傳播的特性，這個導數怎麼算是要自己來寫的！把每一層的結點的導數計算公式封裝在結點內部後，再來使用反向傳播，反向傳播的特性就是：鏈式法則，或者說反向傳播是符合鏈式法則的，有了這個前提，我們纔可以

2020-07-04 12:09:04

caffe-車尾識別

caffe-車尾識別 opencv，caffe，傳統方法和深度方法結合 http://weibo.com/PVl32019.01.075t3p/2313474325750605004851/wenda_home http://weibo.

2020-07-04 11:12:41

whats is the difference between train, validation and test set, in neural networks?

The training and validation sets are used during training. for each epoch for each training data instance

2020-07-04 11:12:29

【Deep Learning】基於 Keras 的貓狗分類識別

基於 Keras 的貓狗分類識別更新：本文代碼github連接：https://github.com/Sdamu/Keras_pratice 本篇主要實現利用 Keras 來實現 Kaggle 的經典比賽 ——貓狗識別

2020-07-04 05:07:05

【軟件安裝】安裝pip 出現類似 AttributeError: module 'pip.main' has no attribute '_main'錯誤問題

解決 Ubuntu 安裝pip 出現類似 AttributeError: module ‘pip.main’ has no attribute ‘_main’ 錯誤問題最近在Ubuntu上使用conda新建虛擬環境，當虛擬環

2020-07-04 05:07:05

【Deep Learning】SKNet : Selective Kernel Networks 學習

1. SKNet 論文思維導圖該思維導圖使用 MindMaster 軟件做出，源文件可以點擊鏈接進行下載。 2. Selective kernel 結構介紹本節主要介紹這篇論文的核心部分，即 Selective ke

2020-07-04 05:07:05

24小時熱門文章

最新文章

最新評論文章