數據分析5 - 拓展篇

數據分析實戰5.拓展篇


42丨當我們談深度學習的時候,我們都在談什麼?

目標

在這篇文章中,我們會通過以下幾個方面瞭解深度學習:

  • 數據挖掘、機器學習和深度學習的區別是什麼?這些概念都代表什麼?
  • 我們通過深度學習讓機器具備人的能力,甚至某些技能的水平超過人類,比如圖像識別、下棋對弈等。那麼深度學習的大腦是如何工作的?
  • 深度學習是基於神經網絡構建的,都有哪些常用的網絡模型?
  • 深度學習有三個重要的應用領域,這三個應用領域分別是什麼?

數據挖掘,機器學習,深度學習的區別是什麼?

實際上數據挖掘和機器學習在很大程度上是重疊的。一些常用算法,比如 K-Means、KNN、SVM、決策樹和樸素貝葉斯等,既可以說是數據挖掘算法,又可以說是機器學習算法。那麼數據挖掘和機器學習之間有什麼區別呢?

  • 數據挖掘

數據挖掘通常是從現有的數據中提取規律模式(pattern)以及使用算法模型(model)。核心目的是找到這些數據變量之間的關係,因此我們也會通過數據可視化對變量之間的關係進行呈現,用算法模型挖掘變量之間的關聯關係。通常情況下,我們只能判斷出來變量 A 和變量 B 是有關係的,但並不一定清楚這兩者之間有什麼具體關係。在我們談論數據挖掘的時候,更強調的是從數據中挖掘價值

  • 機器學習

機器學習是人工智能的一部分,它指的是通過訓練數據和算法模型讓機器具有一定的智能。一般是通過已有的數據來學習知識,並通過各種算法模型形成一定的處理能力,比如分類、聚類、預測、推薦能力等。這樣當有新的數據進來時,就可以通過訓練好的模型對這些數據進行預測,也就是通過機器的智能幫我們完成某些特定的任務。

  • 深度學習

深度學習屬於機器學習的一種,它的目標同樣是讓機器具有智能,只是與傳統的機器學習算法不同,它是通過神經網絡來實現的。神經網絡就好比是機器的大腦,剛開始就像一個嬰兒一樣,是一張白紙。但通過多次訓練之後,“大腦”就可以逐漸具備某種能力。這個訓練過程中,我們只需要告訴這個大腦輸入數據是什麼,以及對應的輸出結果是什麼即可。通過多次訓練,“大腦”中的多層神經網絡的參數就會自動優化,從而得到一個適應於訓練數據的模型。

  • 機器學習 & 深度學習

所以你能看到在傳統的機器學習模型中,我們都會講解模型的算法原理,比如 K-Means 的算法原理,KNN 的原理等。而到了神經網絡,我們更關注的是網絡結構,以及網絡結構中每層神經元的傳輸機制。我們不需要告訴機器具體的特徵規律是什麼,只需把我們想要訓練的數據和對應的結果告訴機器大腦即可。深度學習會自己找到數據的特徵規律!而傳統機器學習往往需要專家(我們)來告訴機器採用什麼樣的模型算法,這就是深度學習與傳統機器學習最大的區別。

  • 神經網絡

另外深度學習的神經網絡結構通常比較深,一般都是 5 層以上,甚至也有 101 層或更多的層數。這些深度的神經網絡可以讓機器更好地自動捕獲數據的特徵。

總結


43丨深度學習(下):如何用Keras搭建深度學習網絡做手寫數字識別?

目標

  • 進一步瞭解 CNN 網絡。CNN 網絡在深度學習網絡中應用很廣,很多網絡都是基於 CNN 網絡構建的,你有必要進一步瞭解 CNN 的網絡層次,尤其是關於卷積的原理。
  • 初步瞭解 LeNet 和 AlexNet。它們都是經典的 CNN 網絡,我們今天的任務就是認識這些經典的 CNN 網絡,這樣在接觸更深度的 CNN 網絡的時候,比如 VGG、GoogleNet 和 ResNet 這些網絡的時候,就會更容易理解和使用。
  • 對常用的深度學習框架進行對比,包括 Tensorflow、Keras、Caffe、PyTorch、 MXnet 和 Theano。當選擇深度學習框架的時候到底該選擇哪個?
  • 使用 Keras 這個深度學習框架編寫代碼,完成第一個深度學習任務,也就是 Mnist 手寫數字識別。

總結

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章