原创 Numpy的+=操作、Numpy中的隨機數

原地操作與非原地操作 +=:原地操作 +:非原地操作 對於Numpy array切片的修改,是原地操作,會影響原有array 對於Python List切邊的修改,是非原地操作,不會影響原有List random.rand() 根據給定維

原创 Python中的多線程和多進程

Python中存在多線程,但是很遺憾,python僅僅只支持一個線程的運行。 主要原因是,thread不支持守護線程。當主線程退出時,所有的子線程不管它們是否還在工作,都會被強行退出。有時我們並不希望發生這種行爲,這時就引入了守護線程的概

原创 Python多進程多線程

大部分操作系統(如Windows、Linux)的任務調度是採用時間片輪轉的搶佔式調度方式,也就是說一個任務執行一小段時間後強制暫停去執行下一個任務,每個任務輪流執行。任務執行的一小段時間叫做時間片,任務正在執行時的狀態叫運行狀態,任務執行

原创 單層感知器實踐

import numpy as np import matplotlib.pyplot as plt #輸入數據 X = np.array([[3,3], [4,3], [1,1

原创 sklearn-多項式迴歸

import numpy as np import matplotlib.pyplot as plt from sklearn.preprocessing import PolynomialFeatures from sklearn.

原创 k-近鄰算法

#科學計算包 from numpy import * # 運算符模塊 import operator def createDataSet(): group = array([ [1.0,1.1],

原创 四分位數和箱線圖

四分位數 四分位數(Quartile)也稱四分位點,是指在統計學中把所有數值由小到大排列並分成四等份,處於三個分割點位置的數值。 箱線圖 利用數據中的五個統計量:最小值、第一四分位數、中位數、第三四分位數與最大值來描述數據的一種方法。  

原创 數據去除重複值

查看重複值 dataframe.duplicated( ) 刪除重複值 dataframe.drop_duplicates( ) trips1.csv start_id,end_id,start_date 0,55,55,'8/29/2

原创 DataFrame的用法

創建方法 #創建方法 df_1 = pd.DataFrame({'A':[0,1,2],'B':[3,4,5]}) print(df_1) #創建方法 二位數組,列標籤 行索引 df_2 = pd.DataFrame([[0,1,2

原创 數據初識

import pandas as pd stations = pd.read_csv('stations.csv',encoding='utf-8') print(stations.head()) # id name

原创 DataFrame的applymap和apply

DataFrame的applymap 將DataFrame的每個元素經過函數運算之後轉化成新的元素 import pandas as pd df = pd.DataFrame({ 'a':[1,2,3], 'b':[4,

原创 加載CSV到DataFrame和Pandas的軸

從arr.csv文件中讀取 arr.csv date,s1,s2,s3,s4,s5 05-21,27.93 ,28.18 , 29.39 ,40.52 , 26.26 05-22,58.08 ,50.61 , 51.62 ,48

原创 Numpy二維數組和Numpy中的軸

二維數組的表示方法: python原生:列表的列表 Numpy:ndarray Pandas:DataFrame 二維ndarray與Python List 1.ndarry性能更好 2.ndarray有mean()、std()、sum(

原创 DataFrame的向量計算

arr.csv date,s1,s2,s3,s4,s5 05-21,27.93 ,28.18 , 29.39 ,40.52 , 26.26 05-22,58.08 ,50.61 , 51.62 ,48.55 ,54.03 0

原创 讀取DataFrame的數據單元

取某行 loc、iloc 取某列 [xxx] 轉換成Numpy array values import numpy as np import pandas as pd arr = pd.DataFrame({ 's1': [2