每週一書《大數據時代的算法:機器學習、人工智能及其典型實例 》分享!

《大數據時代的算法:機器學習、人工智能及其典型實例》介紹在互聯網行業中經常涉及的算法,包括排序算法、查找算法、資源分配算法、路徑分析算法、相似度分析算法,以及與機器學習相關的算法,包括數據分類算法、聚類算法、預測與估算算法、決策算法、關聯規則分析算法及推薦算法。《大數據時代的算法:機器學習、人工智能及其典型實例》涉及的相關算法均爲解決實際問題中的主流算法,對於工作和學習都有實際參考意義。《大數據時代的算法:機器學習、人工智能及其典型實例》是一本算法領域內的技術參考書籍,涵蓋數十種算法,通過由淺入深的介紹基礎算法和機器學習算法相關理論和應用,闡述了各個算法的應用場景及算法複雜度,使讀者對算法的理解不只是停留在表面,還從應用的角度提供了大量實例,使讀者能夠快速、高效進階各類算法,並能夠熟練應用到將來的工作實踐中。

目錄:

第1章算法基礎...................................1

I.I 基礎算法分析類型………..…………. I

1.1.l 分治法................................. I

1.1.2 動態規劃法......................... 2

1.1.3 回溯法................................. 3

1.1.4 分支限界法…...……………….4

l.1.5 貪心法................................. 4

1.2 算法性能分析….......……………….5

1.3 概率論與數理統計基礎………..….6

1.4 距離計算......................................... 8

1.4.1 歐氏距離............................. 8

1.4.2 馬氏距離............................. 9

1.4.3 曼哈頓距離......................... 9

1.4.4 切比雪夫距離....…………….. 9

1.4.5 閔氏距離............................. 9

1.4.6 海明距離........................... 10

1.5 排序算法....................................... 10

1.5.1 快速排序........................... 11

1.5.2 歸併排序........................... 11

1.5.3 堆排序............................... 13

l.5.4 基數排序........................... 15

1.5.5 外排序............................... 16

1.6 字符壓縮編碼............................... 17

1.6.1 哈夫曼編碼....................... 17

1.6.2 香農-範諾編碼…...…….21

1.7 本章小結....................................... 24

第2章數據查找與資源分配算法…....25

2.1 數值查找算法.....…..…..…......... 25

2.1.1 二分搜索算法···········25

2.1.2 分塊查找算法…………….. 27

2.1.3 哈希查找算法...………...… 28

2.2 字符串查找算法…...…...……....….. 30

2.2.1 Knuth-Morris-Pratt 算法... 31

2.2.2 Boyer-Moore 算法…….34

2.2.3 Sunday 算法······················37

2.3 海址數據中的查找………...…….... 39

2.3.1 基於布隆過濾器查找…... 39

2.3.2 倒排索弓I查找..............….. 41

2.4 銀行家算法................................... 43

2.5 揹包問題······································· 44

2.5.1 0-1揹包問題.................... 45

2.5.2 部分揹包問題………………. 46

2.6 本章小結....................................... 47

第3章路徑分析算法......……....…...... 49

3.1 基千Dijkstra算法的路徑分析............49

3.1.1 應用示例:極地探險....... 49

3.1.2 基於Dijkstra的最短路徑規劃............... 50

3.2 基千Floyd算法的路徑分析…..... 53

3.2. 1 應用示例:任意兩個城

市之間的最短路徑............……... 53

3.2.2 Floyd原理........................ 54

3.2.3 基於Floyd算法計算兩

個城市最短距離……....….. 56

3.3 基於A*算法的路徑搜索……...... 58

3.3.1 應用實例:繞過障礙區

到達目的地....................... 58

3.3.2 A*算法與最短距離計算… 59

3.4 基於維特比算法的概率路徑...... 61

3.4.1 應用實例:推斷天氣狀態... 61

3.4.2 維特比算法思想……… 62

3.4.3 計算天氣狀態..... 62

3.5 最長公共子序列問題…………….. 64

3.5.1 概要................................... 64

3.5.2 最長公共子串………...…… 64

3.5.3 最長公共子序列原理…... 66

3.5.4 實例:求兩宇符串的最

長公共子序列……..…...….. 66

3.6 本章小結·······································68

第4章相似度分析算法…..........69

4.1 應用實例:海量網頁相似度分析............ 69

4.2 基千Jaccard相似係數的相似

度計算........................................... 70

4.2.1 計算流程........................... 70

4.2.2 狹義Jaccard相似係數..... 71

4.2.3 廣義Jaccard相似係數..... 71

4.3 基於MinHash的相似性符法….. 71

4.3.l 與Jaccard相似性關係..... 71

4.3.2 計算網頁文本相似性過程............ 72

4.4 向撮空間模型............................... 73

4.4. l 詞袋模型....................73

4.4.2 TF-IDF算法…..…...…....….74

4.5 基千餘弦相似性算法的相似度

分析············································76

4.5.1 原理基礎........................... 76

4.5.2 公式解析························… 77

4.5.3 計算網頁文本相似性過程... 77

4.6 基千語義主題模型的相似度

算法............................................... 78

4.7 基於SimHash算法的指紋碼....... 80

4.7.1 SimHash弓l入..............….. 81

4.7.2 SimH ash的計算流程…….81

4.7.3 計算重複信息…….....….. 83

4.8 相似度算法的差異性………..….84

4.9 本章小結........................ 85

第5章數據分類算法………………..….86

5.1 基於樸素貝葉斯分類器………..... 86

5.1.1 有監督分類與無監督

分類................................... 87

5.1.2 應用實例:識別車釐子

與櫻桃............................... 88

5.1.3 分類流程歸納................... 91

5.1.4 應用擴展:垃圾郵件

識別···································92

5.1.5 常用評價指標................... 96

5.2 基千AdaBoost分類器…………... 100

5.2.1 AdaBoost概述………….. 100

5.2.2 AdaBoost算法具體流程...........101

5.2.3 AdaBoost算法的應用

實例................................. 102

5 .2.4 AdaBoost算法的優點…. 105

5.3 基千支持向扯機的分類器……… 105

5.3.1 線性可分與線性不可分.. 106

5.3.2 感知器·····························107

5.3.3 支持向量機………......…... 108

5.4 基於K鄰近算法的分類器…..... 109

5.4.1 應用實例:電影觀衆

興趣發現·························109

5.4.2 核心思想......................... 109

5.4.3 電影觀衆興趣發現…….. 110

5.5 本章小結..................................... 1 I 3

第6章數據聚類算法…………....…. 115

6.1 基於系統聚類法…...………………. 115

6.1.1 概述................................. 116

6.1.2 最短距離法..................... 117

6.1.3 重心聚類法..................... 119

6.1.4 動態聚類法.................... 120

6.2 基千K-Means聚類算法…..….. 122

6.2.l 應用實例:新聞聚類...............…. 122

6.2.2 邏輯流程......................... 123

6.2.3 實現新聞聚類分析.....…124

6.2.4 K-Means++ ·················]28

6.2.5 K-中心點聚類算法....................…129

6.2.6 ISODATA聚類算法……. 130

6.3 基於密度的DBSCAN算法....... 131

6.4 基於BIRCH算法的聚類分析... 133

6.4.1 聚類特徵......................... 133

6.4.2 聚類特徵樹…...………... 134

6.5 聚類與分類差異……....……….. 135

6.6 本章小結..................................... 136

第7章數據預測與估算算法……….... 137

7.1 產生式模型與判別式模型…..... 137

7.2 基於最大似然估計的預測……... 138

7.3 基千線性迴歸的估算……………. 140

7.3.1 概要................................. 140

7.3.2 最4、二乘法..................... 141

7.4 基千最大期望算法分析....…..… 143

7.5 基於隱馬爾科夫模型預測.....… 144

7.5.J 應用實例:高溫天氣與

行爲概率......................... 144

7.5.2 原理分析......................... 145

7.5.3 高溫天氣與行爲概率….. 147

7.6 基於條件隨機場的序列預測….. 151

7.6.1 應用實例......................... 151

7.6.2 原理分析…................ 15 I

7.6.3 條件隨機場的優缺點….. 153

7.7 本章小結·····································154

第8章數據決策分析算法……..…….. 155

8.1 基千ID3算法的決策分析....….. 156

8.1.1 信息量............................. 156

8.1.2 信息嫡............................. 156

8.1.3 信息增益......................... 157

8.1.4 ID3算法流程…....…........ 157

8.1.5 ID3算法的應用………….. 157

8.2 基千C4.5算法的分類決策樹.. 159

8.2.1 概要................................. 159

8.2.2 應用實例......................... 159

8.3 基於分類迴歸樹的決策劃分… 161

8.3.l 概要................................. 162

8.3.2 應用實例: 決策劃分..... 163

8.3.3 剪枝................................. 164

8.4 基於隨機森林的決策分類.…... 168

8.4.1 隨機森林的特點……..….. 169

8.4.2 隨機森林的構造方法.…. 169

8.4.3 應用實例: 決定車釐子

的售價層次………………… 170

8.5 本章小結..................................... 172

第9章數據關聯規則分析算法…...... 174

9.1 基千Apriori算法的關聯項

分析............................................. 174

9.1.1 應用實例:超市的貨架

擺放問題......................... 175

9.1.2 基本概要......................... 175

9.1.3 算法原理·························176

9.1.4 有效擺放貨架……………. 176

9.2 基於FP-Growth算法的關聯性

分析............................................. 179

9.2.1 構建FP樹....................... 179

9.2.2 頻繁項分析......………….. 181

9.2.3 與Apripri算法比較…. 184

9.3 基於Eclat算法的頻繁項集

挖掘............................................. 184

9.4 本章小結..................................... 185

第10章數據推薦算法……………..….. 187

10.1 概要........................................... 187

10.1.1 推薦算法發展…………... 188

10.1.2 協同過泥推薦…...… ·…. 189

10.2 基於Item-Based協同過濾推薦········190

I 0.2.1 Item-Based基本思想.… 190

I 0.2.2 Slope One實例:基於評分推薦······190

10.3 基千User-Based協同過濾推薦........ 193

10.3.1 應用實例:根據人羣的推薦............. 194

10.3.2 User-Based與Item-Based對比..... 197

10.4 基於潛在因子算法的推薦... 198

I 0.4. l 應用實例:新聞推薦... 198

10.4.2 流行度與推薦….....…… 200

10.5 推薦算法與效果評價…..……….201

10.6 本章小結···································203

如果想得到下載地址,請訪問中科院計算所培訓中心官網 www.tcict.cn 添加官網上的客服微信索取!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章