原创 對於數據混亂程度的判定準則:基尼不純度、信息熵、方差

兩者都是對數據混雜程度的測度。 總結一句:對於標稱型數據我們通常用信息熵或者基尼不純度來判定混亂程度,對於數值型問題則用方差作爲判斷標                  準。 出處:http://blog.csdn.net/lingtia

原创 機器學習理論與實戰(八)迴歸 相關公式詳解

機器學習理論與實戰(八)迴歸        按照《機器學習實戰》的主線,結束有監督學習中關於分類的機器學習方法,進入迴歸部分。所謂迴歸就是數據進行曲線擬合,迴歸一般用來做預測,涵蓋線性迴歸(經典最小二乘法)、局部加權線性迴歸、

原创 特徵縮減係數的理解等 嶺迴歸 lasso

出處:http://blog.csdn.net/autoliuweijie/article/details/50285881 總結來說,加入特徵縮減係數是爲了減少影響係數小的特徵,保留重要的特徵。 1. 理論 概述: 通過

原创 五大常用算法之一:分治算法

分治算法 一、基本概念    在計算機科學中,分治法是一種很重要的算法。字面上的解釋是“分而治之”,就是把一個複雜的問題分成兩個或更多的相同或相似的子問題,再把子問題分成更小的子問題……直到最後子問題可以簡單的直接求解,原問題的解即

原创 hash算法原理詳解

一.概念 哈希表就是一種以 鍵-值(key-indexed) 存儲數據的結構,我們只要輸入待查找的值即key,即可查找到其對應的值。 哈希的思路很簡單,如果所有的鍵都是整數,那麼就可以使用一個簡單的無序數組來實現:將鍵作爲索引,

原创 五大常用算法之四:回溯法

1、概念       回溯算法實際上一個類似枚舉的搜索嘗試過程,主要是在搜索嘗試過程中尋找問題的解,當發現已不滿足求解條件時,就“回溯”返回,嘗試別的路徑。    回溯法是一種選優搜索法,按選優條件向前搜索,以達到目標。但當探索到某一

原创 python中set和frozenset方法和區別

出處:http://www.cnblogs.com/panwenbin-logs/p/5519617.html python中set和frozenset方法和區別 set(可變集合)與frozenset(不可變集合)的區別:se

原创 Python定義的函數(或調用)中參數*args 和**kwargs的用法

出處:http://blog.csdn.net/chenjinyu_tang/article/details/8136841 Python中*args 和**kwargs的用法 當函數的參數不確定時,可以使用

原创 爲什麼會python還需要shell,shell編程的好處

會shell編程主要方便一些操作,有時候沒有必要寫python腳本,會shell就很方便。 具體請參考:https://www.zhihu.com/question/21747474

原创 五大常用算法之五:分支限界法

分支限界法 一、基本描述     類似於回溯法,也是一種在問題的解空間樹T上搜索問題解的算法。但在一般情況下,分支限界法與回溯法的求解目標不同。回溯法的求解目標是找出T中滿足約束條件的所有解,而分支限界法的求解目標則是找出滿足約束條

原创 學習Linux之創建、刪除文件和文件夾命令

總結:新建目錄用 mkdir,新建文件有 vi 或 touch。 今天學習了幾個命令,是創建、刪除文件和文件夾的,在linux裏,文件夾是目錄,下面說下我學習的命令。 創建文件夾【mkdir】   一、mkdir命令使用權限  

原创 用ipython的好處

1、Tab自動補全功能; 2、magic命令; 3、歷史命令查詢功能; 4、快速獲得文檔、幫助等; 。。。。。。。。 具體請參考https://www.zhihu.com/question/51467397?from=profile_q

原创 淺談協方差矩陣

一、統計學的基本概念 統計學裏最基本的概念就是樣本的均值、方差、標準差。首先,我們給定一個含有n個樣本的集合,下面給出這些概念的公式描述: 均值: 標準差: 方差: 均值描述的是樣本集合的中間點,它告訴我們的信息是有限的,而標

原创 MySQL數據庫引擎

剛學習數據庫,本來沒有引擎的概念,書上遇到了,於是網上找了一篇文章充實一下。 出處:http://blog.csdn.net/wangyang1354/article/details/50740041 經常用MySQL數據庫,但是

原创 標準c++庫分類簡介

轉載:http://blog.csdn.net/panker2008/article/details/462708751:標準c++庫和stl庫     理解兩個庫,大致就一句話:stl是c++標準庫的一個子集,c++的標準庫主要有三部分