一、numpy、scipy、matplotlib、pandas
1.numpy
numpy是python科學計算中的基礎包之一,它的功能包括多維數組、高級數學函數(比如線性代數運算和傅里葉變換),以及爲隨機生成器。numpyi數組是基本數據結構,numpy的核心功能是ndarray,及多維數組。例如:
import numpy as np
x=np.array([[1,2,3],[4,5,6]])
print("x:\n{}".format(x))
x:
[[1 2 3]
[4 5 6]]
2. scipy
scipy是python中用於科學計算的函數集合,它具有線性代數高級程序、數學函數優化、信號處理、特殊數學函數、統計分佈等多項功能。scipy中最重要的是scipy.sparce:它可以給出稀疏矩陣。如果想保存一個大部分元素都是0的二維數組,就可以使用稀疏矩陣。例如:
from scipy import sparse
eye=np.eye(4)
print("Numpy array:\n{}".format(eye))
Numpy array:
[[1. 0. 0. 0.]
[0. 1. 0. 0.]
[0. 0. 1. 0.]
[0. 0. 0. 1.]]
3.matplotlib
matplotlib是python的主要科學繪畫圖庫,其功能是可發佈的可視化內容,如折線圖、直方圖、散點圖等。
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
x=np.linspace(-10,10,100)
y=np.sin(x)
plt.plot(x,y,marker="x")

4.pandas
pandas是用於處理和分析數據的python庫,它基於一種叫做DataFrame的數據結構,簡單來說,一個pandas dataframe就是一張表格,類似excel表格,pandas裏面含有大量用於修改表格和操作表格的方法,尤其是可以像SQL一樣對錶格進行查詢和連接,pandas強大之處在於可以從許多文件格式和數據庫中提取數據,如SQL、EXCEL文件和逗號分隔值文件。下面是利用字典創建DataFrame的一個小例子。
import pandas as pd
from IPython.display import display
#創建關於人的簡單數據集
data={'Name':["Jone","Anna","Peter","Linda"],
'Location':["New York","Paris","Berlin","Londonn"],
'Age':[24,13,56,34]
}
data_pandas=pd.DataFrame(data)
#IPython.display可以在Jupyter Notebook中打印出“美觀的”DataFrame
display(data_pandas)
結果如下:
Age Location Name
0 24 New York Jone
1 13 Paris Anna
2 56 Berlin Peter
3 34 Londonn Linda
查詢這個表的方法有很多種,如下:
#選擇年齡大於30的所有行
display(data_pandas[data_pandas.Age>30])
Age Location Name
2 56 Berlin Peter
3 34 Londonn Linda
5.mglean
通常用於快速美化繪圖,或者用於獲取一些有趣的數據。由於不頻繁使用這裏不做簡紹。
以下代碼是默認的並且常用的庫:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import mglean