上海复旦大学吴立德教授深度学习课程一

原創

2020-06-07 22:32

简介

DL是ML的分支，DL的框架与ML框架的一部分。

ML框架

数据 D

$D = {x i, y i | 1 \leq i \leq m}$
xi 是监督学习的训练数据输入，yi 输入训练数据对应的输出.

模型 M

F={f(x;θ),θ∈Θ}

线性模型：y=f(x)=ωTx+b

广义线性模型：y=f(x)=ωTϕ(x)+b

非线性模型：ANN - - -DL模型

准则 C

损失函数 L(y,f(x))

经验风险R(θ)=1m∑mi=1L(yi,f(xi,θ))

正则项：||ω||2

目标函数： minR(θ)+λ||ω||2

线性模型和广义线性模型

对于一部分数据来说，本身就是稀疏的，可以通过线性模型直接优化求解的模型，有很大一部分数据本身不是稀疏度，不可以通过线性模型直接求解，但是此类数据在其他域如小波域，DCT域等可以稀疏表示，从而通过线性模型进行优化求解。

ANN简介

神经元

y=f(∑iwiai+bi)

神经层
多个神经元组成神经层。

神经网

全参数ANN问题

可训练参数太多
1. 计算资源要大需要海量的CPU来玩这个算法。
2. 数据量充足数据量小，参数多，过拟合的问题就严重了。
3. 算法效率要高茫茫大海中如何去寻找那组最优的参数需要高效的进行。
4. 解释困难虽然模型取得效果，但是很难直观解释为什么模型会work。
5. 当神经网络层数增多时问题变为非凸优化问题，引入局部极值问题。
6. 具有梯度弥散问题，当层数增多时会出现过拟合问题。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

caffe中增加自己的layer

假設新增加的層命名爲：NEW 1. 在src/proto的LayerParameter 的 LayerType下加 NEW= 數字； 2. 在src/layer_factory.cpp中，加 case LayerParam

2020-07-07 08:02:37

Fast RCNN ubuntu下安装笔记

微軟研究院大神Ross Girshick新作：fase CNN，測試速度比RCNN快200倍。文章：http://arxiv.org/pdf/1504.08083v1.pdf 代碼：https://github.com/rbgirshi

2020-07-07 08:02:37

python深度学习---生成式对抗网络（GAN）

生成式對抗網絡（GAN，generative adversarial network）由 Goodfellow 等人於 2014 年提出，它可以替代VAE來學習圖像的潛在空間。 ''' # 它能夠迫使生成圖像與真實圖像在統計上幾乎無

2020-07-06 21:30:11

深度学习设计

損失函數設計： 1、目標檢測領域：不提倡使用預測框座標與GT座標的差值進行損失函數統計，因爲座標差值會受座標尺寸大小影響，座標尺寸大的時候，差值相對大，座標尺寸小，差值相對小。改進：使用IOU，IOU不受座標尺寸因素的影響。（兩種座

2020-07-06 19:28:01

cuda error

1. 問題描述想把從圖像手工生成的特徵和經過backbone提取的特徵concatenate起來再進入網絡後面的層： x_added_coord = torch.cat([x_backbone, x_coord], 1) 報錯： Ru

2020-07-05 20:39:46

pytorch Dataloader 速度慢

1. 問題描述 Dataloader每讀完一個batch中間會間隔2s左右，很浪費時間，而且確定不是由於Dataset的__getitem__()複雜導致的。並且有一個規律，如果設置num_works=4，會出現4個batch一批很快，然

2020-07-05 20:39:35

深度学习基本术语

1、關於一個事件或對象的描述，稱爲一個“示例”（instance）或“樣本”（sample），“示例”或“樣本”的集合稱爲一個“數據集”（data set）。例如，（色澤=青綠；根蒂=蜷縮；敲聲=濁響），（色澤=烏黑；根蒂=

2020-07-05 06:12:43

Deep Learning科普

首先，要由人工智能之父圖靈說起。圖靈曾經有個夢想卸載《計算機器與智能》（1950）一文中，如果有一天，計算機能夠做到，隔着牆，你根本分不清對面和你交流是一個人還是計算機，那麼這臺計算機就具有了人工智能。接下來的半個世紀裏

生命不止coding不息

2020-07-04 20:52:07

理解CNN神经网络

首先構建好用於學習的模型，也就是各個層用什麼激活函數、輸出層的如softmax函數、各層神經元的個數、損失函數等等。然後使用訓練數據集來不斷的調整模型的參數（學習）。具體怎麼做的？首先設定一個初始參數。然後開始學習，計

2020-07-04 12:09:04

What is Back Propaganda？

反向傳播用來計算導數，但這個不是反向傳播的特性，這個導數怎麼算是要自己來寫的！把每一層的結點的導數計算公式封裝在結點內部後，再來使用反向傳播，反向傳播的特性就是：鏈式法則，或者說反向傳播是符合鏈式法則的，有了這個前提，我們纔可以

2020-07-04 12:09:04

caffe-车尾识别

caffe-車尾識別 opencv，caffe，傳統方法和深度方法結合 http://weibo.com/PVl32019.01.075t3p/2313474325750605004851/wenda_home http://weibo.

2020-07-04 11:12:41

whats is the difference between train, validation and test set, in neural networks?

The training and validation sets are used during training. for each epoch for each training data instance

2020-07-04 11:12:29

【Deep Learning】基于 Keras 的猫狗分类识别

基於 Keras 的貓狗分類識別更新：本文代碼github連接：https://github.com/Sdamu/Keras_pratice 本篇主要實現利用 Keras 來實現 Kaggle 的經典比賽 ——貓狗識別

2020-07-04 05:07:05

【软件安装】安装pip 出现类似 AttributeError: module 'pip.main' has no attribute '_main'错误问题

解決 Ubuntu 安裝pip 出現類似 AttributeError: module ‘pip.main’ has no attribute ‘_main’ 錯誤問題最近在Ubuntu上使用conda新建虛擬環境，當虛擬環

2020-07-04 05:07:05

【Deep Learning】SKNet : Selective Kernel Networks 学习

1. SKNet 論文思維導圖該思維導圖使用 MindMaster 軟件做出，源文件可以點擊鏈接進行下載。 2. Selective kernel 結構介紹本節主要介紹這篇論文的核心部分，即 Selective ke

2020-07-04 05:07:05

24小時熱門文章

最新文章

最新評論文章