原创 對於數據混亂程度的判定準則:基尼不純度、信息熵、方差

兩者都是對數據混雜程度的測度。總結一句:對於標稱型數據我們通常用信息熵或者基尼不純度來判定混亂程度,對於數值型問題則用方差作爲判斷標                  準。出處:http://blog.csdn.net/lingtianyu

原创 機器學習理論與實戰(八)迴歸 相關公式詳解

機器學習理論與實戰(八)迴歸按照《機器學習實戰》的主線,結束有監督學習中關於分類的機器學習方法,進入迴歸部分。所謂迴歸就是數據進行曲線擬合,迴歸一般用來做預測,涵蓋線性迴歸(經典最小二乘法)、局部加權線性迴歸、嶺迴歸和逐步線性迴歸。先來看下

原创 特徵縮減係數的理解等 嶺迴歸 lasso

出處:http://blog.csdn.net/autoliuweijie/article/details/50285881總結來說,加入特徵縮減係數是爲了減少影響係數小的特徵,保留重要的特徵。1. 理論概述:通過對損失函數(即優化目標)加

原创 五大常用算法之一:分治算法

分治算法一、基本概念在計算機科學中,分治法是一種很重要的算法。字面上的解釋是“分而治之”,就是把一個複雜的問題分成兩個或更多的相同或相似的子問題,再把子問題分成更小的子問題……直到最後子問題可以簡單的直接求解,原問題的解即子問題的解的合併。

原创 hash算法原理詳解

一.概念哈希表就是一種以 鍵-值(key-indexed) 存儲數據的結構,我們只要輸入待查找的值即key,即可查找到其對應的值。哈希的思路很簡單,如果所有的鍵都是整數,那麼就可以使用一個簡單的無序數組來實現:將鍵作爲索引,值即爲其對應的值

原创 五大常用算法之四:回溯法

1、概念回溯算法實際上一個類似枚舉的搜索嘗試過程,主要是在搜索嘗試過程中尋找問題的解,當發現已不滿足求解條件時,就“回溯”返回,嘗試別的路徑。回溯法是一種選優搜索法,按選優條件向前搜索,以達到目標。但當探索到某一步時,發現原先選擇並不優或達

原创 python中set和frozenset方法和區別

出處:http://www.cnblogs.com/panwenbin-logs/p/5519617.htmlpython中set和frozenset方法和區別set(可變集合)與frozenset(不可變集合)的區別:set無序排序且不重

原创 Python定義的函數(或調用)中參數*args 和**kwargs的用法

出處:http://blog.csdn.net/chenjinyu_tang/article/details/8136841Python中*args 和**kwargs的用法當函數的參數不確定時,可以使用*args 和**kwargs,*a

原创 爲什麼會python還需要shell,shell編程的好處

會shell編程主要方便一些操作,有時候沒有必要寫python腳本,會shell就很方便。具體請參考:https://www.zhihu.com/question/21747474

原创 五大常用算法之五:分支限界法

分支限界法一、基本描述類似於回溯法,也是一種在問題的解空間樹T上搜索問題解的算法。但在一般情況下,分支限界法與回溯法的求解目標不同。回溯法的求解目標是找出T中滿足約束條件的所有解,而分支限界法的求解目標則是找出滿足約束條件的一個解,或是在滿

原创 學習Linux之創建、刪除文件和文件夾命令

總結:新建目錄用 mkdir,新建文件有 vi 或 touch。今天學習了幾個命令,是創建、刪除文件和文件夾的,在linux裏,文件夾是目錄,下面說下我學習的命令。創建文件夾【mkdir】一、mkdir命令使用權限所有用戶都可以在終端使用

原创 用ipython的好處

1、Tab自動補全功能;2、magic命令;3、歷史命令查詢功能;4、快速獲得文檔、幫助等;。。。。。。。。具體請參考https://www.zhihu.com/question/51467397?from=profile_question

原创 淺談協方差矩陣

一、統計學的基本概念統計學裏最基本的概念就是樣本的均值、方差、標準差。首先,我們給定一個含有n個樣本的集合,下面給出這些概念的公式描述:均值:標準差:方差:均值描述的是樣本集合的中間點,它告訴我們的信息是有限的,而標準差給我們描述的是樣本集

原创 MySQL數據庫引擎

剛學習數據庫,本來沒有引擎的概念,書上遇到了,於是網上找了一篇文章充實一下。出處:http://blog.csdn.net/wangyang1354/article/details/50740041經常用MySQL數據庫,但是,你在用的時候

原创 標準c++庫分類簡介

轉載:http://blog.csdn.net/panker2008/article/details/462708751:標準c++庫和stl庫理解兩個庫,大致就一句話:stl是c++標準庫的一個子集,c++的標準庫主要有三部分:c標準庫的