簡單易懂的人工智能系列：機器學習介紹

雲計算

我們日常生活中使用的個人計算機，普遍存在資源使用率低的情況（cpu，內存，硬盤等部分處於空閒狀態），因此我們可以將這三部分抽象出來，依據不同情況分給特定的對象使用完成相應的任務，來提高資源利用率，這種技術被稱爲虛擬化，已經比較成熟。

而如果這些使用的對象是企業或者機構，設想一下，如果我們的計算機資源處在特定的地點，我們是不是也可以按需組合計算機資源，然後分配給有需求的對象呢？

雲計算的概念

雲計算是一種按使用量付費的模式，這種模式提供可用的、便捷的、按需的網絡訪問，進入可配置的計算資源共享池（資源包括網絡、服務器、存儲、應用軟件、服務），這些資源能夠被快速提供，只需投入很少的管理工作，或與服務供應商進行很少的交互。

大數據

大數據是指無法在可承受的時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合，是需要新處理模式才能具有更強的決策裏、洞察發現力和流程優化力的海量、高增長率和多樣化的信息資產。

但是實際上，一般提到“大數據”的時候，可能包括多方面的內容，比如數據採集，存儲計算，分析應用，人工智能等等。大數據不再單單指數據本身，同時還包括處理數據和存儲數據技術，以及對數據的遷移應用。

雲計算與大數據的關係

雲計算提供存儲和計算的基礎設置，而大數據則是運行在其上的實際應用。

打個比方，雲計算相當於房屋裏的設備和設施，而大數據則是在這些設施上開展的一系列活動。

人工智能

人工智能 AI，簡單的講，就是會學習的計算機程序。詳細的人工智能分類和介紹可看這篇文章 —> 人工智能知多少

什麼是機器學習

機器學習是對於某類任務T和性能度量P，如果一個計算機程序，在T上以P衡量的性能隨着經驗E而不斷自我完善，那麼我們稱這個計算機程序從經驗E中學習。

簡單的說就是，在性能P的度量下，通過一定的算法從大量的歷史數據或者策略中學習產生最佳模型，來完成預測任務。任何計算機程序通過經驗來提高某任務處理性能的行爲，都稱爲機器學習。

類似教小朋友認識貓，事先給他一些貓的圖片，讓他對貓的外表有一點的認識，下次他再見到新的有可能是貓的動物的時候，就可以從之前學習到的貓的定義，來判定是否是貓這種動物。

我們使用上述對機器學習的定義再舉個實際編程的栗子：西洋跳棋

機器學習的思路：

任務T：下西洋跳棋
性能指標P：贏棋的概率
經驗E：和自己對弈
確定的目標函數：V

我們對棋盤的狀態b進行評估：

x1：棋盤上黑子的個數
x2：棋盤上紅子的個數
x3：棋盤上黑王的個數
x4：棋盤上紅王的個數
x5：棋盤上被紅子威脅的黑子個數
x6：棋盤上被黑子威脅的紅子個數

但是上面6個特徵它們說明棋局好壞的能力也不同，有的代表性強，有的代表性弱，所以我們要給它們賦予一定的權重：

那麼V(b)就是一個目標函數，對於每一種走子b，目標函數都可以計算出一個實數值來說明棋局的好壞。

比如黑子贏了的棋局，我們將它的函數值定位爲V(bi)=+100，這種情況下，已經沒有紅子，那麼這個棋局就可以表示爲：

有了上面這些表示，我們就可以運用一些對局的局來訓練我們的系統，那麼就想通過這些樣本來選擇一組最合適的權值，讓所有棋局與我們最終的預測結果都儘可能一致。

任何一個樣本棋局都要表示爲這樣一個數據對<b,V(b)>,其中的V(b)我們通過給出來些近似函數V_hat(b)來手動的標記。

剩下的事情就是爲這個學習算法選擇最合適訓練樣例的權。一種常用的方法是把最佳的假設（或權重向量集合）定義爲使訓練值和假設預測出的值間的誤差平方和E最小：

而對於具體的實現方法本文裏我們就不做深入論述，後續文章是會有機器學習算法詳解和程序實現。

我們來總結一下機器學習解決西洋跳棋問題的所具有的特點：

無需傳統模式編程
定義任務、性能、經驗以及目標函數。並提供目標函數學習方式即可
隨着數據的變化，能自動學習、更新
利用自己對弈=>優化模型的方式，可以持續提升

適用場景：

不宜針對問題進行手工編程
不能定義該問題的解決方案
基於複雜數據的快速決策
大規模的個性化系統

機器學習和人工智能

人工智能是一個相對較大的過程，機器學習就是實現人工智能的一種方法，而深度學習是機器學習的分支，是機器學習的一種技術。三者的關係大致如下圖：

機器學習的發展歷程

基礎奠定時期：40年代末到60年代中

停滯期：60年代中到70年代末

這是機器學習的低潮期，但人們並沒有停止研究的步伐，這個時期主要是模擬人類的概念學習過程，並採用邏輯結構或圖結構作爲機器內部描述，但這期間很少有震驚的成果。

復興時期：70年代末至80年代末

從70年代末開始，人們從學習單個概念擴展到學習多個概念，探索不同的學習策略和各種學習方法
1980年，在美國的卡內基梅隆大學（CMU）召開了第一屆機器學習國際研討會
多層感知機（MLP）由偉博斯在1981年的神經網絡反向傳播算法（BP）中具體提出
1985-1986神經網絡研究人員（魯梅爾哈特，辛頓，威廉姆斯-赫，尼爾森）先後提出了MLP與BP訓練相結合的理念
1986年昆蘭提出決策樹算法，更準確的說是ID3算法

復興時期：90年代初到21世紀初

蓬勃發展期：21世紀初至今（深度學習）

機器學習的應用

機器學習研究趨勢

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

簡單易懂的人工智能系列：機器學習介紹

雲計算

雲計算的概念

大數據

雲計算與大數據的關係

人工智能

什麼是機器學習

機器學習和人工智能

機器學習的發展歷程

機器學習的應用

機器學習研究趨勢

簡單易懂的人工智能系列：機器學習基本概念（一）

python奇技淫巧：性能優化（一）

前端JavaScript工具函數（請自取）

數據庫學習筆記：消息隊列重複消費、順序消費、分佈式事務

簡單易懂的人工智能系列：K-means算法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結