台部落象牙塔小明

pandas讀取excel設置第一列爲序號設置參數index_col=0可以設置讀取excel時第一列爲序號，否則會自動添加一列序號從0開始： data = pd.read_excel(file_path, index_col=

2020-06-18 06:41:39

函數參數： numpy.random.choice(a, size=None, replace=True, p=None) 參數解釋 a 一維數組或整數。如果是個數組，則新的樣本元素來自這個數組；如果是整數，隨機樣

2020-06-18 06:31:52

導入數據數據清洗數據清洗的一些梳理查看數據，對數據有一個直觀的理解，初步發現一些問題；例如：kaggle房價預測先查看每個數據的具體意義和數據類型和Exel對比。 kaggle房價預測數據集的具體描述缺失值清洗格式內

2020-06-18 06:13:50

在sklean的預處理方法中主要有三種,每一種都有函數方法和類方法兩種使用方法：歸一化-標準化：normalize()函數/Normalizer()類區間縮放-調整尺度: minmax_scale函數/MinMaxScaler

2020-06-17 12:58:49

代碼中【1】【2】參照後面博客 import numpy as np from operator import itemgetter def creat_dataset(): group = np.array([[1.

2020-06-17 12:07:04

線性迴歸（Linear Regression）決策樹（Decision Tree）聚類（Clustering）-機器學習_周志華直觀的解釋SVM和SVR 峯度與偏度（python，pandas）

2020-06-17 12:07:04

MSSubClass: Identifies the type of dwelling involved in the sale. 20 1-STORY 1946 & NEWER ALL STYLES 30 1-S

2020-06-17 12:07:03

博客推薦：快速排序簡單理解（實現原理以及不穩定性） # include<vector> # include <iostream> //# include<algorithm> using namespace std; ////

2020-06-17 12:07:03

1. 用anaconda安裝pydotplus 要說一下的是在python3.5以前用pydot。python3.5及以後pydot已經停止開發了，要用pydotplus。此博客用的python3.7版本。在anaconda中安

2020-06-17 12:07:03

numpy中的ndarray與pandas的Series和DataFrame之間的相互轉換 Series轉換爲ndarray是一個一維數組 DataFrame轉換爲ndarray是一個多維數組

2020-06-17 12:07:03

from keras.datasets import reuters import numpy as np (train_data, train_labels), (test_data, test_labels) = reut

2020-06-09 03:48:01

方法描述 count 計算分組中非NA值的數量 sum 計算非NA值的和 mean 計算非NA值的平均值 median 計算非NA值的算術中位數 std、var 計算非NA值標準差和方差 min

2020-02-22 07:37:32

看了很多博客，感覺很多人對np.random.binomial()的解釋都寫得不是很清楚，或者寫錯了，特別是對該函數的參數解釋。本文以二項式分佈的理論概念爲起點，對該函數進行解釋，歡迎討論指正。二項式分佈二項分佈是由伯努利提出

2020-02-22 07:37:32

例如：如下案例有兩個錯誤 from sklearn.datasets import load_boston from sklearn.feature_selection import SelectKBest from sklear

2020-02-22 07:37:32

例如數組： arr = [True, False, False] 計算True和False的個數： import numpy as np print('True個數：'， np.sum(arr!=0)) print('False個

2020-02-22 07:37:32