原创 R語言速成_尹鴻(一)基本操作

賦值 > x <- 5 #賦值 > ls() #查看已經創建的變量 [1] "x" > age <- c(1,3,5,2,11,9,3,9,12,3) > weight <- c(4.4,5.3,7.2,5.2,8.5,7.

原创 pandas_cookbook學習(八)

切片一個數據集: In [122]: df = pd.DataFrame(data={'Case' : ['A','A','A','B','A','A','B','A','A'], .....:

原创 pandas_cookbook學習(六)

使用resample和apply函數分別變換: In [103]: rng = pd.date_range(start="2014-10-07",periods=10,freq='2min') In [104]: ts = pd.S

原创 pandas_cookbook學習(七)

根據索引值將每一組數據滯後一項: In [112]: df = pd.DataFrame( .....: {u'line_race': [10, 10, 8, 10, 10, 8], .....: u'bey

原创 pandas_cookbook學習(五)

使用剩下值的均值代替此值,注意transform的用法,與apply相區分: apply返回一個聚類結果,transform分別返回每個處理的結果 In [94]: df = pd.DataFrame({'A' : [1, 1, 2,

原创 pandas_cookbook學習(四)

缺失數據處理 對時間序列中缺失值的操作: In [79]: df = pd.DataFrame(np.random.randn(6,1), index=pd.date_range('2013-08-01', periods=6, fr

原创 pandas_cookbook學習(三)

多重索引 > df = pd.DataFrame({'row' : [0,1,2], ....: 'One_X' : [1.1,1.1,1.1], ....:

原创 pandas_cookbook學習(二)

選擇數據 dataframes > df = pd.DataFrame( ....: {'AAA' : [4,5,6,7], 'BBB' : [10,20,30,40],'CCC' : [100,50,-30,-50]

原创 pandas_cookbook學習(一)

必要庫的導入: import pandas as pd import numpy as np import functools 1 Idioms df = pd.DataFrame( ...: {'AAA' : [4

原创 pandas縱向學習之10 minutes to pandas(二)

pandas縱向學習之10 minutes to pandas(一) 布爾值索引 df[df.A>0] A B C D 2013-01-02 0.356680 -0.468280 1.293093 -0.752251 2013-

原创 pandas縱向學習之10 minutes to pandas(四)

時間序列 resample函數的用法: In [14]: rng = pd.date_range('1/1/2012', periods=100, freq='S') In [15]: ts = pd.Series(np.random

原创 pandas縱向學習之10 minutes to pandas(一)

10mins官方文檔 10 Minutes to pandas 必要的庫導入: import pandas as pd import numpy as np import matplotlib.pyplot as plt 創建對

原创 爬取bing每日美圖作爲桌面背景

需先安裝pypiwin32,可通過如下代碼安裝: pip install pypiwin32 完整代碼: import re import win32gui, win32con, win32api from urllib imp

原创 urllib之爬蟲

urllib-Python3文檔鏈接 致謝@python修行路 1.初識urllib urllib庫包含以下模塊: urllib.request——打開和讀取 URLs urllib.error——urllib.request異

原创 pandas縱向學習之10 minutes to pandas(三)

pandas縱向學習之10 minutes to pandas(二) pandas縱向學習之10 minutes to pandas(一) 操作 數學統計 df.mean() #查看每列的平均值 df.mean(1) #查看每行的