台部落Alvin

KNN算法鄰近算法，或者說K最近鄰(kNN，k-NearestNeighbor)分類算法是數據挖掘分類技術中最簡單的方法之一。所謂K最近鄰，就是k個最近的鄰居的意思，說的是每個樣本都可以用它最接近的k個鄰居來代表。 Cov

2019-09-16 15:09:46

要理解生成對抗模型（GAN），首先要知道生成對抗模型拆開來是兩個東西：一個是判別模型，一個是生成模型。兩個例子：兩個人比賽，看是 A 的矛厲害，還是 B 的盾厲害。比如，我們有一些真實數據，同時也有一把亂七八糟的假數據。A

2019-09-16 15:09:46

文章目錄三支決策1. 三支決策發展2. 對象和簇關係2.1 怎麼確定關係3. 三支聚類分析3.1 符號含義3.2 三支聚類表示3.3 三支聚類區域關係3.4 三支聚類定義方案3.5 聚類簇的表示3.6 三支軟聚類條件4.

2019-08-28 15:22:49

文章目錄寫在前面決策粗糙集1 決策粗糙集的引入2. Pawlaw經典粗糙集回顧3. 決策粗糙集3.1 問題引入3.2 基本理論3.3 待解決的問題4. 問題處理4.1 閾值$\beta$ 和 $\alpha$ 的解釋和計算（貝葉斯

2019-08-28 15:22:49

好多的數據全球每天都在產生數以兆兆的數據，每個人的行爲都會產生數據；數據的爆炸式增長並且廣泛可用讓我們真正進入數據時代。普通人面對這數據海洋就是束手無策+一臉懵逼（我是誰？我從哪兒來？我要去哪兒？）。但是在這數據海洋中有着無

2019-08-28 15:22:49

文章目錄寫在前面粗糙集1 . 粗糙集相關概念2 . 概念、可定義集2.1 信息表2.2 決策邏輯語言 $\mathbb{L}$2.3 可定義集的形式化定義定義一(子集可定義)：2.4 等價關係E(A)| 不可分辨關係3 . 近

2019-08-28 15:22:49

條件信息熵的決策表約簡文章目錄條件信息熵的決策表約簡寫在前面信息論觀點描述定義1：P，Q 概率分佈定義2：熵 H( P ) 定義定義3：條件熵`H(Q|P)`定義定理1：條件熵`H(Q|P)`計算定理2：不可分辨關係和熵定理3：

2019-08-28 15:22:48

文章目錄數據對象、屬性和相似性數據對象屬性屬性類型數據對象相似性、相異性數據對象、屬性和相似性數據對象別名：樣本、實例、數據點或對象一般使用屬性對應屬性值來描述數據對象哈士奇：傻、大、黑白、撕家屬性

2019-08-28 15:22:48

文章目錄信息論在機器學習中的常見概念1. 信息量2. 熵3. 聯合熵4. 條件熵5. 相對熵6. 互信息7. 信息增益公式與推導信息論在機器學習中的常見概念信息的不確定度表示。 1. 信息量定義：消除事件不確定性所需的信息量

2019-08-28 15:22:48

文章目錄數據倉庫、OLAP和數據立方體1. 數據倉庫1.1. 數據倉庫定義1.2. 關鍵術語解釋2. 數據倉庫和數據庫的區別3. OLAP3.1. 基本概念1）維2）操作3.2. OLAP分類4. 數據立方體4.1. 維災難

2019-08-28 15:22:48

介紹在C++中，內存分成5個區，他們分別是堆、棧、自由存儲區、全局/靜態存儲區和常量存儲區。　　棧：在執行函數時，函數內局部變量的存儲單元都可以在棧上創建，函數執行結束時這些存儲單元自動被釋放。棧內存分配運算內置於處理器的

2019-08-09 15:11:51

STL標準模板庫思維導圖 C++ 語言的核心優勢之一就是便於軟件的重用。C++ 中有兩個方面體現重用：一是面向對象的繼承和多態機制；二是通過模板的概念實現了對泛型程序設計的支持。 C++ 的標準模板庫（Standard Te

2019-07-31 15:13:12

數據挖掘–聚類思維導圖資源文件：請稍後

2019-07-31 15:13:12

數據挖掘-樸素貝葉斯分類什麼是分類？分類是一種重要的數據分析形式，它提取刻畫重要數據類的模型。這種模型稱爲分類器，預測分類的（離散的，無序的）類標號。例如醫生對病人進行診斷是一個典型的分類過程，醫生不是一眼就看出病人得了哪種

2019-07-07 15:13:52

頻繁模式增長Frequent-Pattern Growth（FP-Growth）由於Apriori算法的兩大缺陷：大量候選集問題多次訪問數據庫 FP-Growth特點：將代表頻繁項集的數據庫壓縮成一棵頻繁模式樹無候

2019-06-10 16:11:39