數據分析5 - 拓展篇

原創

请叫我子鱼

2020-06-08 07:02

數據分析實戰5.拓展篇

42丨當我們談深度學習的時候，我們都在談什麼？

目標

在這篇文章中，我們會通過以下幾個方面瞭解深度學習：

數據挖掘、機器學習和深度學習的區別是什麼？這些概念都代表什麼？
我們通過深度學習讓機器具備人的能力，甚至某些技能的水平超過人類，比如圖像識別、下棋對弈等。那麼深度學習的大腦是如何工作的？
深度學習是基於神經網絡構建的，都有哪些常用的網絡模型？
深度學習有三個重要的應用領域，這三個應用領域分別是什麼？

數據挖掘，機器學習，深度學習的區別是什麼？

實際上數據挖掘和機器學習在很大程度上是重疊的。一些常用算法，比如 K-Means、KNN、SVM、決策樹和樸素貝葉斯等，既可以說是數據挖掘算法，又可以說是機器學習算法。那麼數據挖掘和機器學習之間有什麼區別呢？

數據挖掘

數據挖掘通常是從現有的數據中提取規律模式（pattern）以及使用算法模型（model）。核心目的是找到這些數據變量之間的關係，因此我們也會通過數據可視化對變量之間的關係進行呈現，用算法模型挖掘變量之間的關聯關係。通常情況下，我們只能判斷出來變量 A 和變量 B 是有關係的，但並不一定清楚這兩者之間有什麼具體關係。在我們談論數據挖掘的時候，更強調的是從數據中挖掘價值。

機器學習

機器學習是人工智能的一部分，它指的是通過訓練數據和算法模型讓機器具有一定的智能。一般是通過已有的數據來學習知識，並通過各種算法模型形成一定的處理能力，比如分類、聚類、預測、推薦能力等。這樣當有新的數據進來時，就可以通過訓練好的模型對這些數據進行預測，也就是通過機器的智能幫我們完成某些特定的任務。

深度學習

深度學習屬於機器學習的一種，它的目標同樣是讓機器具有智能，只是與傳統的機器學習算法不同，它是通過神經網絡來實現的。神經網絡就好比是機器的大腦，剛開始就像一個嬰兒一樣，是一張白紙。但通過多次訓練之後，“大腦”就可以逐漸具備某種能力。這個訓練過程中，我們只需要告訴這個大腦輸入數據是什麼，以及對應的輸出結果是什麼即可。通過多次訓練，“大腦”中的多層神經網絡的參數就會自動優化，從而得到一個適應於訓練數據的模型。

機器學習 & 深度學習

所以你能看到在傳統的機器學習模型中，我們都會講解模型的算法原理，比如 K-Means 的算法原理，KNN 的原理等。而到了神經網絡，我們更關注的是網絡結構，以及網絡結構中每層神經元的傳輸機制。我們不需要告訴機器具體的特徵規律是什麼，只需把我們想要訓練的數據和對應的結果告訴機器大腦即可。深度學習會自己找到數據的特徵規律！而傳統機器學習往往需要專家（我們）來告訴機器採用什麼樣的模型算法，這就是深度學習與傳統機器學習最大的區別。

神經網絡

另外深度學習的神經網絡結構通常比較深，一般都是 5 層以上，甚至也有 101 層或更多的層數。這些深度的神經網絡可以讓機器更好地自動捕獲數據的特徵。

總結

43丨深度學習（下）：如何用Keras搭建深度學習網絡做手寫數字識別？

目標

進一步瞭解 CNN 網絡。CNN 網絡在深度學習網絡中應用很廣，很多網絡都是基於 CNN 網絡構建的，你有必要進一步瞭解 CNN 的網絡層次，尤其是關於卷積的原理。
初步瞭解 LeNet 和 AlexNet。它們都是經典的 CNN 網絡，我們今天的任務就是認識這些經典的 CNN 網絡，這樣在接觸更深度的 CNN 網絡的時候，比如 VGG、GoogleNet 和 ResNet 這些網絡的時候，就會更容易理解和使用。
對常用的深度學習框架進行對比，包括 Tensorflow、Keras、Caffe、PyTorch、 MXnet 和 Theano。當選擇深度學習框架的時候到底該選擇哪個？
使用 Keras 這個深度學習框架編寫代碼，完成第一個深度學習任務，也就是 Mnist 手寫數字識別。

總結

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

數據分析5 - 拓展篇

數據分析實戰5.拓展篇

42丨當我們談深度學習的時候，我們都在談什麼？

43丨深度學習（下）：如何用Keras搭建深度學習網絡做手寫數字識別？

PDManer [元數建模]-v4.9.0 發佈：一款簡單好用的數據庫建模平臺

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

cs01 CSS Syntax

挑戰程序設計競賽 2.3章習題 poj 3046 Ant Counting

[MASM拾遺]Offset僞指令

h30 HTML Layout Elements

瞭解顯卡

一款基於C#開發的通訊調試工具（支持Modbus RTU、MQTT調試）

Linux/Golang/glibC系統調用

cs04 CSS Measurement Units

數學之美3 - 線代篇

數學之美1 - 離散篇

數學之美2 - 概率篇

機器學習算法02 - 決策樹

數據挖掘算法02 - C4.5

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結