整理一些Python數據類型相關的方法,備忘。
1、list to ndarray方法:
b = np.array(a)
a是list類型,b爲ndarray類型。
2、查看元素類型
type(Object)
3、查看列表的維度(要先轉化爲ndarray類型,再查看維度)
np.array(a).shape #a爲列表
4、直接獲取csv文件中的某一列
df = pd.read_csv(“D:/01.csv”)
a = []
a = df.nyecpmrate #這裏的nyecpmrate爲csv文件中某一列的標籤
#a的類型爲pandas.core.series.Series
5、pandas.core.series.Series轉化爲ndarray類型
b = np.array(a)
b爲ndarray類型,a爲pandas.core.series.Series類型
6、pandas.core.series.Series類型可以直接用來做散點圖折線圖
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_csv("D:/01.csv")
X = df.nyecpmrate
y = df.nyfillraterate
plt.plot(X, y,'k.')
plt.show()
效果圖如下:
7、ndarray to list
#定義一個numpy.ndarray
a=numpy.array([1,2,3,4,5,6])
b=array.tolist() #b爲list類型
8、最大,最小,獲取列表長度
max(list)
返回列表元素最大值
len(list)
列表元素個數
min(list)
返回列表元素最小值
list(seq)
將元組轉換爲列表
9、其他
1 list.append(obj)
在列表末尾添加新的對象
2 list.count(obj)
統計某個元素在列表中出現的次數
3 list.extend(seq)
在列表末尾一次性追加另一個序列中的多個值(用新列表擴展原來的列表)
4 list.index(obj)
從列表中找出某個值第一個匹配項的索引位置
5 list.insert(index, obj)
將對象插入列表
6 list.pop([index=-1])
移除列表中的一個元素(默認最後一個元素),並且返回該元素的值
7 list.remove(obj)
移除列表中某個值的第一個匹配項
8 list.reverse()
反向列表中元素
9 list.sort(cmp=None, key=None, reverse=False)
對原列表進行排序
10、python pandas加載.txt文件
df = pd.read_csv("path",delimiter="\t")
11、python爲數據添加列標籤
df.columns=['ads_info','ads_id','country','durtion','n','is_clicked','source']
12、python 刪除某一列
df1 = df.drop('ads_info',axis=1)
13、python根據某元素刪除整行
df2 = df1[df1.ads_id == 'ca-app-pub-2075998924432436/1327048797']
14、dataframe類型數據按某列名屬性排序
dfnew1.sort_values(by='durtion')
15、多屬性去重
frame=frame.drop_duplicates(['state'])
16、python保存文件
data.to_csv("data.csv")
不保存行列索引。
data.to_csv("data.csv",index=False,header=False)
16、python去噪聲(通過控制值範圍來實現)
data = data[data['size']<= 500]