原创 假設空間 版本空間&查全率 查準率

一、假設空間 版本空間根據P4表1.1和P5圖1.1得,       假設空間爲:     1 色澤=*,     根蒂=*,    敲聲=*2 色澤=青綠, 根蒂=*,    敲聲=*3 色澤=烏黑, 根蒂=*,    敲聲=*4 色澤

原创 Python運算符和表達式

本文轉載自http://www.cnblogs.com/yueya/p/5811937.html 算術運算符: 比較運算符: 賦值運算符: 位運算符: 邏輯運算符: 身份運算符: 對比:isinst

原创 1.Python基礎要點(一)

變量:變量可不定義,但一定要有賦值。 一、python基礎 1、輸出和輸入 輸出 在print()中輸入字符串,就可以向屏幕上輸出相應的字符串,如'hello world'; print()也可以接受多個字符串,用逗號隔開,每個逗號代表

原创 1.Python基礎要點(二)

注:本文部分內容來自廖雪峯的Python教程,部分內容來自網上搜索,部分內容由自己編寫。 函數(一) 位置參數、默認參數適合用於預先已知需要的參數的個數; 可變參數、關鍵字參數適合用於不知參數個數的情況。 一、位置參數 func(X,X)

原创 1.python基礎要點(三)

注:本文主要轉載自廖雪峯的python教程,部分內容由自己編寫。 一、函數 (1)遞歸函數 定義:如果一個函數在內部調用自身本身,這個函數就是遞歸函數。 在函數內部,可以調用其他函數。如果一個函數在內部調用自身本身,這個函數就

原创 Java小筆記

 

原创 scikit-learn的主要模塊和基本使用

本文轉載自JasonDing簡書專欄,地址爲http://www.jianshu.com/p/1c6efdbce226 引言 對於一些開始搞機器學習算法有害怕下手的小朋友,該如何快速入門,這讓人挺掙扎的。 在從事數據科學的人中,最常用

原创 Pandas——ix vs loc vs iloc區別

重點:loc一般是索引標籤,iloc只能索引數字,而ix可以索引兩種類型:標籤和數字。 1. loc——通過行標籤索引行數據(loc會把:的最後一位也算進去) 1.1 loc[1]表示索引的是第1行(index 是整數)

原创 機器學習實戰之線性迴歸+局部加權線性迴歸

一、線性迴歸 用線性迴歸找到最佳擬合直線 迴歸的目的是預測數值型數據,根據輸入寫出一個目標值的計算公式,這個公式就是迴歸方程(regression equation),變量前的係數(比如一元一次方程)稱爲迴歸係數(regression

原创 PCA數學原理

本文轉自:http://mp.weixin.qq.com/s?src=3&timestamp=1505011423&ver=1&signature=DgOcZ6tIf3lWEbUJ8NSJKXJ-DXas8riXEaw8DCGsNoFcb

原创 Python數據分析必備Anaconda安裝、快捷鍵、包安裝

本文轉自http://www.cnblogs.com/jackchen-Net/p/6909395.html 要點導航 1.Anaconda操作2.安裝Graphviz 3.Anaconda的快捷鍵4.創建多環境的Anaconda5

原创 正則表達式

字符串是編程時涉及到的最多的一種數據結構,對字符串進行操作的需求幾乎無處不在。比如判斷一個字符串是否是合法的Email地址,雖然可以編程提取@前後的子串,再分別判斷是否是單詞和域名,但這樣做不但麻煩,而且代碼難以複用。正則表達式是一種用來

原创 python字符串

注意:本文內容主要是自廖雪峯的python基礎教程的歸納總結,紫色字體是個人添加的內容。一、字節的概念8個比特(bit)作爲一個字節(byte),所以,一個字節能表示的最大的整數就是255(二進制11111111=十進制255),如果要表

原创 基於LSTM對時間序列進行預測

本文的案例來自https://machinelearningmastery.com/time-series-prediction-lstm-recurrent-neural-networks-python-keras/注:以下內容在該案例

原创 基於CENTOS6.5搭建Hadoop集羣

一、安裝虛擬機二、環境nat配置Nat設置:查看得到192.168.201.2su命令,打開以下文件,刪除其他行以得到下圖:添加以下行:對slave1和slave2也做同樣操作:三、配置JDK環境共享目錄share到Linux系統(/mn