人工智能基礎複習1——人工智能概述

01 Intro

課程大綱

- 第一部分:人工智能概述/Introduction and Agents(chapters 1,2)
- 第二部分:問題求解/Search(chapters 3,4,5,6)
- 第三部分:知識與推理/Logic(chapters 7,8,9,10)
- 第四部分:不確定知識與推理/Uncertainty(chapters 13-17)
- 第五部分:學習/Learning(chapters 18-21)

概論
- 什麼是AI
- AI的歷史
- AI的現狀

什麼是AI
- 像人一樣思考:認知模型
- 合理地思考:思想的準則,邏輯系統傾向於在不確定性存在的情況下做錯誤的事情
- 像人一樣行動:圖靈測試,知識,推理,語言理解,學習
- 合理地行動:合理Agent

Agent是能夠感知和行動的一個實體。本課程就是有關如何設計合理Agent(rational agent)的
抽象地說,一個Agent就是從感知歷史到行動的一個函數:[ f: P*→A ]
在任何給定的環境和任務下,我們尋求性能最優的Agent

AI前史
哲學:邏輯、推理方法、頭腦作爲學習的物理系統基礎、語言、合理性
數學:形式化表示和算法證明、計算、(不)可決定性、(不)易處理性、可能性
經濟學:效用、決策理論
神經科學:腦活動的物理底層
心理學:感知和運動神經的控制現象、實驗性技術
計算機工程:建造高效的計算機
控制論:設計能隨時最大化目標函數(objective function)的系統
語言學:知識表示、語法

AI歷史
The gestation of AI 孕育期 (-1956)
Reasoning methods 注重推理時期 (1956-1975)
Knowledge-based system 知識運用時期 (1976-1988)
Integration 集成運用 (1989-present)

The Gestation of AI
古希臘Aristotle(亞里士多德BC 384-322),給出形式邏輯的基本規律Syllogism(三段論)
英國Bacon(培根1561-1626),系統地給出Induction(歸納法)
德國Leibnitz(萊布尼茨1646-1716)提出Symbolic Logic(數理邏輯)
英國Boole(布爾1815-1864)提出Boolean Algebra(布爾代數)系統,實現了思維符號化和數學化
1936英國Turing(圖靈,1912-1954):理想計算機模型Turing Machine(圖靈機)
1946美國Mauchly(莫克利),Eckert(埃克特):ENIAC
1948美國Shannon(香農):Information Theory(消息論)
1950 Turing Test圖靈測試

The Birth of AI(1956)
John McCarthy於1956年夏天在達特茅斯組織了一個爲期兩個月的研討會,參與會議的十個人是:MaCarthy,Minsky,Rochester,Shannon,Moore,Samuel,Selfridge,Solomonff,Simon,Newell
會議中互相介紹了所有主要的人物,並採用了Artificial Intelligence作爲領域的名稱

AI簡史
1943——McCulloch&Pitts:大腦的布爾電路模型
1950——Turing的計算機器和智能
1956——Dartmouth會議,AI這個名詞得到採納
1952-69——Look,Ma,no hands!
1950s——早期的AI程序,包括Samuel的西洋跳棋程序、Newell&Simon的邏輯理論、Gelernter的幾何發動機
1965——Robinson的關於邏輯推理的完備性算法
1966-73——AI發現的計算複雜性、神經網絡研究幾乎消失
1969-79——基於知識系統的早期發展
1980-- ——AI開始成爲一項產業
1986-- ——神經網絡重新得到普及
1987-- ——AI開始成爲一項科學
1995-- ——智能Agent開始出現

今日的AI
大多數是關於特定工程領域的解決方案,而非創造常規理論
表示信息和解決特定任務的工具:神經網絡、隱馬爾科夫模型、貝葉斯網絡、啓發式搜索、邏輯…
AI沒有什麼magic,就是關於表示、優化、可能性和算法的科學

有名的AI應用
專家系統(有機化學、醫學、地質學、計算機配置)、語音識別、手寫識別、遊戲(象棋、西洋跳棋、圍棋)、機器人(自動車、乒乓球玩家、本田機器人)、自動理論證明、網絡搜索引擎、自然語言理解(機器翻譯,谷歌)、物流調度(軍事-人力、貨物、交通)、巡航導彈、微軟回答嚮導

02 Agents

Agent通過傳感器感知環境並通過執行器對所處環境產生影響
包括人類、機器人、軟件機器人、自動調溫器等
人類Agent:眼睛、耳朵和其他器官等傳感器,手、腿、嘴等作爲執行器
機器Agent:攝像頭、紅外測距儀作爲傳感器,各種馬達作爲執行器

Agent和環境
Agent函數從感知歷史映射到行動上: [f: P*→A ],Agent程序運行在物理結構上來產生f,agent = architecture + program
吸塵器的例子:感知:位置和狀態:如[A.Dirty];行爲:Left, Right, Suck, NoOp
function Reflex-Vacuum-Agent([location,status]) returns an action
    if status = Dirty then return Suck
    else if location = A then return Right
    else if location = B then return Left

理性Agent
做事正確的Agent,基於它所能感知的和所能執行的行動,所謂正確的行動,就是能讓Agent更成功
性能度量:衡量一個Agent的成功行爲的一項客觀標準
例如,吸塵器Agent的性能度量可能是:清除的灰塵數量、所花費的時間多少、所消耗的電量多少、所產生的噪音大小
理性智能體:對於每一個可能的感知序列,理性智能體應該基於已知的感知序列提供的信息,和智能體已有的先驗知識,選擇能夠使它的性能度量最大化的行爲
理性(Rationality)不同於全知(omniscience)
爲修改未來的感知信息而採取行動——信息收集
理性智能體應該能夠儘可能地學習,以彌補不全面或不正確的先驗知識
Rational ≠ omniscient(全知的)≠ clairvoyant(洞察力)=> rantional ≠ successful;Rational => exploration, learning, autonomy

PEAS
Performance measure(性能度量)、Environment(環境)、Actuators(執行器)、Sensors(傳感器)
例子1:自動駕駛出租車
P:安全性、目的、收益、合法性、舒適性...
E:街道/高速公路、交通、行人、天氣...
A:方向盤、加速器、剎車、喇叭、揚聲器/顯示器...
S:錄像機、加速計、燃油表、引擎傳感器、鍵盤、GPS...
例子2:網購Agent
P:價格、質量、適用性、效率
E:當前和未來的WWW網站、賣方、託運商
A:向用戶展示商品、跟蹤URL地址、填寫表單
S:HTML網頁(文本、圖表、腳本)

環境的類型
完全可觀察的(vs.部分可觀察的):Agent的傳感器在每個時間點上都能獲取環境的完整狀態
確定的(vs.隨機的):環境的下一個狀態完全取決於當前狀態和Agent執行的動作
片段式的(vs.延續式的):Agent的經歷被分成了一個個原子片段,在每個片段中Agent感知信息並完成單個行動,下一個片段不依賴於以前的片段中採取的動作(如裝配線上檢測次品零件的機器人只需要把每次決策建立在當前零件基礎上,不用考慮以前的決策)
靜態的(vs.動態的):Agent計算時環境不變(如果環境不變但是Agent性能評價隨時間變化,稱爲半動態的)
離散的(vs.連續的):數目上有限的確切定義的感知和行動
單Agent(vs.多Agent):在環境中獨立運行的Agent
舉例:
Chess with a clock:完全可觀察的、確定的、延續式的、半動態的、離散的、多Agent的
Chess without a clock:完全可觀察的、確定的、延續式的、靜態的、離散的、多Agent的
出租車駕駛:部分可觀察的、隨機的、延續式的、動態的、連續的、多Agent的
真實世界是部分可觀察的、隨機的、延續式的、動態的、連續的、多Agent的

Agent函數和程序
Agent函數是理性的
目標:找到實現理性Agent函數的簡單方式
Table-lookup agent
\input{algorithms / table-agent-algorithm}
缺點:表太大、建表時間長、不自主、學習時間長
Agent類型:均能轉變爲學習Agent
4種基本Agent程序:簡單反射Agent、基於模型的反射Agent、基於目標的Agent、基於效用的Agent

概括
Agent通過執行器和傳感器與環境交互
Agent函數描述了Agent在什麼情況下做什麼事
性能度量評估環境序列
一個完全理性的Agent最大限度提高預期性能
Agent程序實現(一些)Agent函數
PEAS描述定義了任務環境
環境分爲幾個方面:可觀察的?確定的?片段的?靜態的?離散的?單一Agent的?
幾種基本的Agent結構:reflex,reflex with state,goal-based,utility-based

發佈了43 篇原創文章 · 獲贊 100 · 訪問量 17萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章