1.1.1區別
1.1.1.1特徵提取方面
- 機器學習的特徵工程步驟是要靠手動完成的,而且需要大量領域專業知識
- 深度學習通常由多個層組成,它們通常將更簡單的模型組合在一起,通過將數據從一層傳遞到另一層來構建更復雜的模型。通過大量數據的訓練自動得到模型,不需要人工設計特徵提取環節。
深度學習算法試圖從數據中學習高級功能,這是深度學習的一個非常獨特的部分。因此,減少了爲每個問題開發新特徵提取器的任務。適合用在難提取特徵的圖像、語音、自然語言領域
1.1.2深度學習應用場景
- 圖像識別
- 物體識別
- 場景識別
- 車型識別
- 人臉檢測跟蹤
- 人臉關鍵點定位
- 人臉身份認證
- 自然語言處理技術
- 機器翻譯
- 文本識別
- 聊天對話
- 語音技術
- 語音識別
1.1.3深度學習代表算法-神經網絡
1.1.3.1神經網絡
人工神經網絡(ArtificialNeuralNetwork,簡寫爲ANN)也簡稱爲神經網絡(NN)。是一種模仿生物神經網絡(動物的中樞神經系統,特別是大腦)結構和功能的計算模型。經典的神經網絡結構包含三個層次的神經網絡。分別輸入層,輸出層以及隱藏層。
其中每層的圓圈代表一個神經元,隱藏層和輸出層的神經元有輸入的數據計算後輸出,輸入層的神經元只是輸入。
- 神經網絡的特點
- 每個連接都有個權值,同一層神經元之間沒有連接
- 神經元當中會含有激活函數
- 最後的輸出結果對應的層也稱之爲全連接層
神經網絡是深度學習的重要算法,用途在圖像(如圖像的分類、檢測)和自然語言處理(如文本分類、聊天等)
那麼爲什麼設計這樣的結構呢?首先從一個最基礎的結構說起,神經元。以前也稱之爲感知機。神經元就是要模擬人的神經元結構。
一個神經元通常具有多個樹突,主要用來接受傳入信息;而軸突只有一條,軸突尾端有許多軸突末梢可以給其他多個神經元傳遞信息。軸突末梢跟其他神經元的樹突產生連接,從而傳遞信號。這個連接的位置在生物學上叫做“突觸”。
1.1.3.2神經網絡理解案例
我們以票房預測的例子說明
輸入影響票房的N個因素,這裏舉例四個因素,結果輸出一個Y預測票房結果
1.1.4爲什麼深度學習現在效果非常好
過去十多年,得益於數字社會的發展,積累了大量的數據。以前的一些算法到達了瓶頸期,它們無法適用於大量的數據。"大規模"一直推動深度學習的發展進步。不僅僅是數據量的大,算法模型規模越來越大等。
- 數據
- 計算
- 訓練網絡需要GPU、TPU
- 算法
- 一些創新,如ReLU激活函數