深度學習-場景、數據、模型

參考

《深度學習:基於Keras的Python實踐》_魏貞原/《深度學習:基於Keras的Python實踐》_魏貞原.pdf

其他

Keras 是 Python 在深度學習領域非常受歡迎 的類庫之一,但 Kerns 的側重點是深度學習 , 而不是所有的機器學習。事實上, Keras 力求極簡主義 , 只專注於快速、簡單地定 義和構建深度學習模型所需要的內容。 

Python中的 Scikit-Leam是非常受歡迎的機器學習庫 , 它基於 SciPy, 用於高效的數值計算。 Scikit-Leam 是一個功能齊全的通用機器學習 庫,並提供 了許多在開發深度學習模型 中非常有幫助的方法,例如, Scikit-Leam 提供了很多用於選擇模型和對模型調優的方法,這些方法同樣適用於深度學習。

深度學習模型的評估

k 折交叉驗證

多層感知器實例

Pima Indians 數據集,糖尿病發病情況數據集

二分類問題

多分類問題

鶯尾花分類,Scikit-Learn 帶有數據集

銀行營銷分類,Banking Marking 

迴歸問題

波士頓房價預測

數據是 1978年統計收集的,包含以下 14個特徵和 506條數據。

推薦系統

item-user

movielens

 

翻譯系統

nmt、平行語料

文本生成

語料:愛麗絲夢遊仙境

keras

LSTM、0-1編碼、gensim加載詞典和映射

自動摘要

語言模型

srilm

主題模型

LDA、LDA4j、sphinx

gensim

困惑度

序列分類

IMDB影評分類

情感分析

IMDB影評情感分析

在這裏使用 IMDB 提供的數據集中的評論信息來分析一部電影 的好壞,數據集由IMDB (htψ://www.imdb.com/interfaces/)提供,其中包含了 25000 部電影的評價信息。該數據集是斯坦福大學的研究員整理的 , 在 2011 年的論文中 , 採用該數據集的 50%用於訓練, 50%用於評估算法模型,達到 88.89%的準確度。

手寫數字識別

卷積神經網絡、MNIST

圖像識別

CIFAR-10分類

這個數據集由 Alex Krizhevsky、 Vinod Nair和 Geo世ey Hinton 收集整理 , 共包含了60000張32x32的彩色圖像, 50000張用於訓練模型、 10000張用於評估模型。 可以從其 主頁 (http://www.cs.toronto.edu/~kriz/cifar.html ) 下載。 訓l陳數據集被均勻地分成 10個類別, 每個類別剛好包含5000張圖片。 

多層感知器的時間序列預測

國際旅行人數預測

這裏使用一個經典的數據集一一 國際旅行旅客人數數據集,來研究分析序列問題 。這個數據集包含從 1949 年 1 月到 1960 年 12 月,共 12 年 144 條記錄,數據集中的人數 以千人爲單位 。 可以免費從 DataMarket 上下載這個數據集,在這裏選擇下載 csv 格式 的文件,下載地址是 http://data.is/1bKs2mG。

LSTM

多變量時間序列預測

PM2.5

本章將通過空氣污染預測來說明如何實現多變量時間序列的預測問題。這個數據集 是美國駐華( 北京)大使館五年內報告的天氣和污染水平。 數據集中包含日期、 PM2.5污染物濃度,以及天氣信息,包括露點(露點溫度)、溫度、壓力、風向、風速、累計的 降雪小時數和累計的降水小時數 。 數據集中的數據包括從 2010 年 l 月 1 號到 2014 年 12月 31 號的數據。數據集可以到 UCI機器學習倉庫網站下載( http://archive.ics.uci.edu/ml/datasets/Beijing+PM2.5+Data )。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章