原创 二、決策樹(Decision Tree)

二、決策樹(Decision Tree) 算法基本思想:根據數據集中數據的特徵進行逐步的推理、判斷,從而達到分類或預測的目的。決策樹屬於圖解法,因爲類似於樹的結構,因此成爲決策樹。常見的決策樹算法有ID3、C4.5以及CART。 算法舉例

原创 深入解析C++中的構造函數和析構函數

深入解析C++中的構造函數和析構函數 構造函數:在類實例化對象時自動執行,對類中的數據進行初始化。構造函數可以重載,可以有多個,但是隻能有一個缺省構造函數。 析構函數:在撤銷對象佔用的內存之前,進行一些操作的函數。析構函數不能被重載,只

原创 各種距離彙總

在做分類時常常需要估算不同樣本之間的相似性度量(SimilarityMeasurement),這時通常採用的方法就是計算樣本間的“距離”(Distance)。採用什麼樣的方法計算距離是很講究,甚至關係到分類的正確與否。   本文的目的就

原创 數據結構中各類排序算法

數據結構中各類排序算法 一、插入排序 1.直接插入排序  直接插入排序(straight insertion sort)的做法是:  每次從無序表中取出第一個元素,把它插入到有序表的合適位置,使有序表仍然有序。  第一趟比較前兩

原创 統計學習方法——CART, Bagging, Random Forest, Boosting

統計學習方法——CART, Bagging, Random Forest, Boosting 本文轉自:http://blog.csdn.net/abcjennifer/article/details/8164315 本文從統計

原创 C++ 中的this指針

C++中的this指針 一個對象的this指針並不是對象本身的一部分,不會影響sizeof(對象)的結果。this作用域是在類內部,當在類的非靜態成員函數中訪問類的非靜態成員的時候,編譯器會自動將對象本身的地址作爲一個隱含參數傳遞給函數。

原创 C++模板

C++模板   模板是C++支持參數化多態的工具,使用模板可以使用戶爲類或者函數聲明一種一般模式,使得類中的某些數據成員或者成員函數的參數、返回值取得任意類型。   模板是一種對類型進行參數化的工具;   通常有兩種形式:函數模板

原创 Hadoop初窺

Hadoop初窺 Hadoop歷史         雛形開始於2002年的Apache的Nutch,Nutch是一個開源Java 實現的搜索引擎。它提供了我們運行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬蟲。        

原创 sizeof的用法

sizeof,一個其貌不揚的傢伙,引無數菜鳥竟折腰,小蝦我當初也沒少犯迷糊,秉着“辛苦我一個,幸福千萬人”的偉大思想,我決定將其儘可能詳細的總結一下。但當我總結的時候才發現,這個問題既可以簡單,又可以複雜,所以本文有的地方並不適合初學者,

原创 歐氏距離與馬氏距離的優缺點是什麼?

歐氏距離與馬氏距離的優缺點是什麼?       歐氏距離(Euclidean distance)也稱歐幾里得度量、歐幾里得度量,是一個通常採用的距離定義,它是在m維空間中兩個點之間的真實距離。在二維和三維空間中的歐氏距離的就是兩點之間的

原创 一、K -近鄰算法(KNN:k-Nearest Neighbors)

一、K -近鄰算法(KNN:k-Nearest Neighbors) 算法基本思想:物以類聚,人以羣分 存在一個樣本數據集合,也稱作訓練樣本集,並且樣本集中每個數據都存在標籤。輸入沒有標籤的新數據後,將新數據的每個特徵與樣本集中數據對應的

原创 機器學習實戰筆記

機器學習實戰筆記 機器學習的概念: 引用Andrew Ng在機器學習課程中說過的一句話“機器學習實際上就是使用一個學習型算法,讓機器學習起來”。機器學習能讓我們自數據集中受到啓發,換句話說,我們會利用計算機來彰顯數據背後的真是含義。 實際

原创 斐波那契查找

斐波那契查找 黃金比例又稱黃金分割,是指事物各部分間一定的數學比例關係,即將整體一分爲二,較大部分與較小部分之比等於整體與較大部分之比,其比值約爲1:0.618或1.618:1。 0.618被公認爲最具有審美意義的比例數字,這個數值

原创 機器學習常見算法分類彙總

機器學習常見算法分類彙總 本文轉載自:http://blog.jobbole.com/77620/ 機器學習無疑是當前數據分析領域的一個熱點內容。很多人在平時的工作中都或多或少會用到機器學習的算法。本文爲您總結一下常見的機器學

原创 C++中重載、覆蓋以及隱藏的區別

C++中重載、覆蓋以及隱藏的區別 C++中重載、覆蓋以及隱藏是經常讓人混淆的三個概念。1、重載有兩個或多個函數名相同的函數,但是函數的形參列表不同。在調用相同函數名的函數時,根據形參列表確定到底該調用哪一個函數。 重載是C++提供的一種靈