台部落请叫我子鱼

線代篇向量空間模型文本檢索文本聚類矩陣線性迴歸 PCA主成分分析奇異值分解 33 | 線性代數：線性代數到底都講了些什麼？向量和向量空間標量（Scalar）。它只是一個單獨的數字，而且不能表示方向。從計

2020-06-19 12:56:16

離散篇程序員的數學基礎課二進制餘數迭代法歸納法遞歸排列 & 組合動態規劃 DPS & BFS 圖時間複雜度 & 空間複雜度反碼 & 補碼位操作開篇詞 | 作爲程序員，爲什麼你應該學好數學？數學它

2020-06-19 10:29:18

概率篇樸素貝葉斯文本分類語言模型馬爾科夫模型決策樹 A/B 測試 19 | 概率和統計：編程爲什麼需要概率和統計？概率和統計裏有哪些需要掌握的概念？隨機變量（Random Variable）來描述事件所有

2020-06-19 10:29:18

決策樹 ID3 & C4.5 & CART 機器學習基本算法之一的決策樹的基本原理，其要點如下：決策樹是包含根節點、內部節點和葉節點的樹結構，通過判定不同屬性的特徵來解決分類問題；決策樹的學習過程包括特徵選擇、決

2020-06-19 10:29:18

C4.5 決策樹學習通常包括三個步驟特徵選擇。選取最優特徵來劃分特徵空間，用信息增益或者信息增益比來選擇決策樹的生成。ID3、C4.5、CART 剪枝什麼是信息熵？隨機變量 x 概率 P(x) 表示 x

2020-06-19 10:29:18

目錄 1、面向對象... 1 2、命名空間 - 避免類名衝突... 1 3、類的繼承 – 可以直接訪問父類定義的方法... 1 4、構造方法和析構方法... 1 5、執行父類的構造方法... 1 6、執行父類的方法... 2 7、實函數、

2020-06-19 10:29:18

K-Means 什麼是向量空間？首先假設有一個數的集合 F，它滿足“F 中任意兩個數的加減乘除法（除數不爲零）的結果仍然在這個 F 中”，我們就可以稱 F 爲一個“域”。我們處理的數據通常都是實數，所以這裏我只考慮實數域。而

2020-06-19 10:29:18

線性迴歸機器學習基本算法之一的線性迴歸的基本原理，其要點如下：線性迴歸假設輸出變量是若干輸入變量的線性組合，並根據這一關係求解線性組合中的最優係數；最小二乘法可用於解決單變量線性迴歸問題，當誤差函數服從正態分佈時，它與

2020-06-19 10:29:18

KNN KNN 的英文叫 K-Nearest Neighbor，應該算是數據挖掘算法中最簡單的一種。 KNN 的工作原理近朱者赤，近墨者黑可以說是 KNN 的工作原理。整個計算過程分爲三步：計算待分類物體與其他物體之間的

2020-06-19 10:29:18

jQuery jQuery這麼流行，肯定是因爲它解決了一些很重要的問題。實際上，jQuery能幫我們幹這些事情：消除瀏覽器差異：你不需要自己寫冗長的代碼來針對不同的瀏覽器來綁定事件，編寫AJAX等代碼；簡潔的操作DOM的方法

2020-06-08 07:02:41

數據分析實戰4.實戰篇 37丨數據採集實戰：如何自動化運營微博？目標掌握 Selenium 自動化測試工具，以及元素定位的方法；學會編寫微博自動化功能模塊：加關注，寫評論，發微博；對微博自動化做自我總結。 Se

2020-06-08 07:02:41

數據分析實戰5.拓展篇 42丨當我們談深度學習的時候，我們都在談什麼？目標在這篇文章中，我們會通過以下幾個方面瞭解深度學習：數據挖掘、機器學習和深度學習的區別是什麼？這些概念都代表什麼？我們通過深度學習讓機器具備人

2020-06-08 07:02:41

搜索引擎整體系統介紹搜索引擎大致可以分爲四個部分：蒐集、分析、索引、查詢。蒐集，就是我們常說的利用爬蟲爬取網頁。分析，主要負責網頁內容抽取、分詞，構建臨時索引，計算 PageRank 值這幾部分工作。索引，主要負責

2020-05-05 04:18:12

樸素貝葉斯樸素貝葉斯分類機器學習基本算法之一的樸素貝葉斯方法的基本原理，其要點如下：樸素貝葉斯方法利用後驗概率選擇最佳分類，後驗概率可以通過貝葉斯定理求解；樸素貝葉斯方法假定所有屬性相互獨立，基於這一假設將類

2020-02-24 18:09:34

PageRank PageRank 的簡化模型假設一共有 4 個網頁 A、B、C、D。它們之間的鏈接信息如圖所示：出鏈指的是鏈接出去的鏈接。入鏈指的是鏈接進來的鏈接。比如圖中 A 有 2 個入鏈，3 個出鏈。簡單來說，

2020-02-24 18:09:34