Artificial Intelligence Term
前言
閱讀書籍DEEP LEARNING
後, 術語解釋.
- AI難點
- deep learning (深度學習)
- AI knowledge base (AI知識庫)
- hard-code (硬編碼)
- representation learning (表示學習)
- machine learning (機器學習)
下圖爲AI包含關係的維恩圖, 該圖出自書籍DEEP LEARNING.
Terminology interpretation
AI的任務
解決對人來說很容易執行, 但很難形式化描述的任務. 如識別人類說的話(自然語言), 或物體的圖像等.
深度學習
通過較簡單的概念來構建較複雜的概念, 這樣會得到一個層次化的概率, 使用這種層次化的概念來讓計算機實現類似人的不容易被人形式化描述的能力.
通過簡單的概念逐漸疊加構建更復雜的概念, 繪製出表示這些概念如何建立在彼此之上的圖, 我們能到得到一張
“深”(層次很多)的圖, 基於這種原因, 這類方法被稱爲深度學習
.
深度學習中典型的模型爲前饋深度網絡
或多層感知機(multilayer perceptron, MLP)
ps: 點動成線, 線動成面, 面動成體. 亦或者我們畫個太陽, 是一動筆就畫太陽的細節(如發出的光), 還是先畫個簡單的圓.
MLP
MLP是一個將一組輸入值映射到輸出值的數學函數, 該數學函數由許多較簡單的函數複合而成.
知識庫
通過將關於世界的知識用形式化的程序語言進行hard-code(硬編碼)
, 計算機可以使用邏輯推理規則來自動地理解這些形式化語言中的聲明, 這也就是AI的知識庫(knowledge base)
方法.
其中最著名的項目爲Cyc
, Cyc包括一個推斷引擎和一個使用CycL語言描述的聲明數據庫. 這些聲明是由人類監督者輸入的. 這是一個很笨拙的過程, 人們設法設計出足夠複雜的形式化規則來精確地描述世界.
hard-code
from wikipedia: 將數據直接嵌入到程序或其他可執行對象的源代碼中的軟件開發實踐,而不是從外部源獲取數據或在運行時生成數據。硬編碼數據通常只能通過編輯源代碼和重新編譯可執行文件來修改,儘管可以使用調試器或十六進制編輯器在內存或磁盤上進行更改。
表示學習
使用機器學習來發掘表示
本身, 而不僅僅只是把表示
映射到輸出, 這種方法被稱作表示學習.
表示學習的經典例子爲自編碼器
.
表示(representation)
這裏的表示的意思是指數據的表示(或描述等等類似的概念), 如使用阿拉伯數字計算和使用羅馬數字計算的效果是不一樣的, 雖然它們計算的結果是一樣的. 有點類似於使用兩種不同的語言C和python來實現同一個功能, 它們的效果是不同的, 但功能結果是相同的.
而表示學習中所說的發掘表示
本身, 其意爲學習並發掘出表示
本身的模式, 並生產另一種表示形式.
我將它理解爲: 提取原有事物的表示方式, 並昇華出更合適或更有效的表示方式, 將表示的方式更加精細化.
自編碼器
自編碼器由一個編碼器函數和解碼器函數構成, 編碼器函數會將原有的表示編碼成另一種表示方式, 而解碼器則是將轉換後的表示方式轉換爲原來的方式.
機器學習
AI系統具有自己獲取知識的能力, 即從原始的數據中提取模式
的能力, 這種能力被稱爲機器學習.
簡單的機器學習算法如邏輯迴歸(logistic regression)
和樸素貝葉斯(naive Bayes)
.