三天搞定python基础-day2

三天搞定python基础系列第一天内容请进传送门:三天搞定python基础-day1


三天搞定python基础-day2

(需要指出,这版三天搞定python系列有点偏向科学计算,机器学习大数据这块,从第二天第三天内容就可以看出来)

大纲:几个python的常用模块的简单应用

  • NumPy:多维数组的有效操作。 高效的数学函数。

  • Matplotlib:可视化:2D和(最近)3D图

  • SciPy:大型库实现各种数值算法,例如:           

    • 线性和非线性方程的解
    • 优化
    • 数值整合
  • Sympy:符号计算(解析的 Analytical)

  • Pandas:统计与数据分析(day3)


一、导入模块

  • 可以通过输入import关键字来导入模块
import numpy
  • 或者使用简称,即将模块通过as关键字来命名一个简称
import numpy as np
  • 有时您不必导入整个模块,就像
from scipy.stats import norm

练习:导入模块时间,并使用它来获取计算机运行特定代码所需的时间

import timeit
def funl (x, y):      
     return x**2 + y**3

t_start  =  timeit.default_timer()
z =  funl(109.2, 367.1)
t_end  =   timeit.default_timer()

cost  =  t_end -t_start
print ( 'Time cost of funl is  %f' %cost)


二、numpy

ndarray类型
  • NumPy提供了一种新的数据类型:ndarray(n维数组)。
    • 与元组和列表不同,数组只能存储相同类型的对象(例如只有floats或只有ints) 
    • 这使得数组上的操作比列表快得多; 此外,阵列占用的内存少于列表。 
    • 数组为列表索引机制提供强大的扩展
import numpy as np

In [1] : np.array([2, 3, 6, 7])   
Out[l] : array([2, 3, 6, 7])   
In [2] : np.array([2, 3, 6, 7.])   
Out [2] :  array([ 2.,  3.,  6., 7.])  <- Hamogenaous   

创建均匀间隔的数组
  • arange:
in[1]:np.arange(5)
Out [l]:array([0,1,2,3,4])

range(start, stop, step)的所有三个参数即起始值,结束值,步长都是可以用的 另外还有一个数据的dtype参数 

np.arange(10,100,20,dtype = float)
array([ 10.,  30.,  50.,  70.,  90.])
np.arange(3, dtype=np.uint8)
array([0, 1, 2], dtype=uint8)
  • linspace(start,stop,num)返回数字间隔均匀的样本,按区间[start,stop]计算:
np.linspace(0.,2.5,5)  
array([0.,0.625,1.25,1.875,2.5])

  这在生成plots图表中非常有用。

  • 注释:即从0开始,到2.5结束,然后分成5等份

多维数组矩阵 (Matrix by multidimensional array)

In [1] : a = np.array([[1, 2, 3],[4, 5, 6]])
                   
In  [2] : a
Out [2] : array([[l, 23] ,[456]])

In  [3] : a.shape  #<- 行、列数等 (Number of rows, columns etc.)
Out [3] : (2,3)

In  [4] : a.ndim   #<- 维度数  (Number of dimensions)
Out [4] : 2

In  [5] : a,size   #<- 元素数量 (Total number of elements)
Out [5] : 6

形状变化 (Shape changing)

import numpy as np

a = np .arange(0, 20, 1) #1维
b = a.reshape((4, 5))   #45列
c = a.reshape((20, 1))  #2
d = a.reshape((-1, 4))  #-1:自动确定
a.shape =(4, 5) #改变a的形状

例子 

import numpy as np

a = np.array([1,2,3,4,5])
b = a.copy ()

c1 =  np.dot(np.transpose(a), b)
print(c1)
c2  = np.dot(a, np.transpose(b))
print(c2)

ax  =  np.reshape(a, (5,1))
bx  =  np.reshape(b, (1,5))
c = np.dot(ax, bx)
print(c)

相同的元素填充数组

In [1] : np.zeros(3)              # zero(),全0填充数组
Out[l] : array([ O., 0., 0.])

In [2] : np.zeros((2, 2), complex)
Out[2] : array([[ 0.+0.j, 0.+0.j],                
                [ 0.+O.j, 0.+0.j]])

In [3] : np.ones((2, 3))          # ones(),全1填充数组
Out[3] : array([[ 1., 1., 1.],
                [ 1., 1., 1.]])

随机数字填充数组

  • rand: 0和1之间均匀分布的随机数 
   In [1] : np.random.rand(2, 4)   
   Out[1] : array([[ 0.373767 , 0.24377115, 0.1050342 , 0.16582644] , 
                   [ 0.31149806, 0.02596055, 0.42367316, 0.67975249l])
  • randn: 均值为0,标准差为1的标准(高斯)正态分布 {standard normal (Gaussian) distribution with mean 0 and variance 1} 
  In [2]: np.random.randn(2, 4)  
  Out[2]: array([[ O.87747152, 0.39977447, -0.83964985, -1.05129899], 
                 [-1.07933484, 0.49448873,   -1.32648606, -0.94193424]])
  • 其他标准分布也可以使用 

数组切片(1D) (Array sliciing(1D))

  • 以格式start:stop可以用来提取数组的片段(从开始到不包括stop)
In [77]:a = np.array([01234])
Out[77]:array([01234])

In [78]:a [13]        #<--index从0开始 ,所以1是第二个数字,即对应1到3结束,就是到第三个数字,对应是2
Out[78]:array([12])
  • start可以省略,在这种情况下,它被设置为零(Notes:貌似留空更合适):
In [79]:a [:3]
Out[79]:array([012])
  • stop也可以省略,在这种情况下它被设置为数组长度:
In [80]:a [1:]
Out[80]:array([1234])
  • 也可以使用负指数,具有标准含义:
In [81]:a [1-1]
Out[81]:array([1,2,3])      # <-- stop为-1表示倒数第二个数
  • 整个数组:a或a [:]  
In [77]:a = np.array([0,1,2,3,4])
Out[77]:array([01234])
  • 要获取,例如每个其他元素,您可以在第二个冒号后面指定第三个数字(步骤(step)):  
In [79]:a [::2]
Out[79]:array([024]) 

In [80]:a [142]
Out[80]:array([1,3])
  • -1的这个步骤可用于反转数组:
In [81]:a [::-1]
Out[81]:array([43210])

数组索引(2D)

  • 对于多维数组,索引是整数元组
In [93] :  a = np.arange(12) ; a.shape =  (34);  a
Out[93] :  array([[0123],
                  [4567],
                  [8, 910, 11]])

In [94] : a[1,2]
Out[94] : 6

In [95] : a[1,-1]
Out[95] : 7

数组切片(2D):单行和列

In [96] : a = np.arange(12); a.shape = (3, 4); a   
Out[96] : array([[0, 1, 2, 3],
                 [4, 5, 6, 7],
                 [8, 9,10,11]])

In [97] : a[:,1]
Out[97] : array([1,5,9])

In [98] : a[2,:]
Out[98] : array([ 8, 9, 10, 11])

In [99] : a[1][2]
Out[99] : 6
  • 不必明确提供尾随的冒号:(Trailing colons need not be given explicitly:)
In [100] : a[2]
Out[100] : array([8,9,10,11]) 

数组索引 

>>> a[0,3:5]
array( [3,4] )

>>> a[4:,4:]
array([[44, 45], 
       [54, 55]])

>>> a[:,2]
array([2,12,22,32,42,52])

>>> a[2: :2, ::2]
array([[20, 22, 24]       
       [40, 42, 44]])


副本和视图

  • 为避免修改原始数组,可以制作一个切片的副本
In [30] : a = np.arange(5); a
Out[30] : array([0, 1, 2, 3, 4])

In [31] : b = a[2:].copy(); b
Out[31] : array([2, 3, 4])

In [32] : b[0] = 100
In [33] : b
Out[33] : array([100, 3, 4])

In [34] : a 
Out[34] : array([ 01234])

矩阵元素乘法

  • 运算符 * 表示元素乘法,而不是矩阵乘法:
In [1]: A = np.array([[1, 2],[3, 4]])
In [2]: A
Out[2]: array([[1, 2],
               [3, 4]])

In [3]: A * A
Out[3]: array([[1, 4],
               [9, 16]])            
  • 使用dot()函数进行矩阵乘法:
In [4]: np.dot(A, A)
Out[4]: array([[ 7, 10],    
               [15, 22]])  

矩阵乘法

  • dot()方法也适用于矩阵向量(matrix-vector)乘法:
In [1]: A
Out[1]: array([[1, 2],[3, 4]])

In [2]: x = np.array([10, 20])
In [3]: np.dot(A, x)
Out[3]: array([ 50, 110])

In [4]: np.dot(x, A)
Out[4]: array([ 70, 100])

将数组保存到文件

  •  savetxt()将表保存到文本文件。 
  • np.savetxt("myfile.txt", a)

  • save()将表保存为Numpy“.npy”格式的二进制文件 

 np.save("myfile" ,a)    

 - 生成一个二进制文件myfile .npy,其中包含一个可以使用np.load()加载的文件。

将文本文件读入数组

  • loadtxt()将以文本文件存储的表读入数组。 (loadtxt() reads a table stored as a text file into an array.)

  • 默认情况下,loadtxt()假定列是用空格分隔的。 您可以通过修改可选的参数进行更改。 以散列(#)开头的行将被忽略。 

  • 示例文本文件data.txt:

    |Year|  Min temp.| Hax temp.|  

    |1990|     -1.5 |      25.3|

    |1991|     -3.2|      21.2|      

  • Code:

   In [1] : tabla = np.loadtxt("data.txt")
   In [2] : table
   Out[2] :
   array ([[ 1.99000000e+03,   -1.50000000e+00,   2.53000000e+01],    
   [ 1.9910000e+03,  -3.2000000e+00,  2.12000000e+01]

Numpy更多高效的功能

  • Numpy包含许多常用的数学函数,例如:

    • np.log
    • np.maximum
    • np.sin
    • np.exp
    • np.abs
  • 在大多数情况下,Numpy函数比Math包中的类似函数更有效,特别是对于大规模数据。


三、scipy库

SciPy的结构

  • scipy.integrate - >积分和普通微分方程
  • scipy.linalg - >线性代数
  • scipy.ndimage - >图像处理
  • scipy.optimize - >优化和根查找(root finding)
  • scipy.special - >特殊功能
  • scipy.stats - >统计功能
  • ...

要加载一个特定的模块,请这样使用, 例如 :

  • from scipy import linalg

线性代数

  • 线性方程的解  (Solution of linear equations:)
import numpy as np
from scipy import linalg    

A = np.random.randn(5, 5)
b = np.random.randn(5)
x = linalg.solve(A, b)     # A x = b#print(x)    
eigen = linalg.eig(A)     # eigens#print(eigen)    
det = linalg.det(A)     # determinant    
print(det)            
  • linalg的其他有用的方法:eig()(特征值和特征向量),det()(行列式)。{Other useful functions from linalg: eig() (eigenvalues and eigenvectors), det() (determinant). } 

数值整合 (Numerical integration)

  • integration.quad是一维积分的自适应数值积分的函数。 (integrate.quad is a function for adaptive numerical quadrature of one-dimensional integrals.)
import numpy as np
from scipy import integrate

def fun(x):
    return np.log(x)

value, error = integrate.quad(fun,0,1)
print(value)
print(error)

Numerical-integration


用Scipy进行统计  (Statistics in Scipy)

  • scipy具有用于统计功能的子库,您可以导入它 (scipy has a sub-library for statistical functions, you can import it by)
from scipy import stats
  • 然后您可以使用一些有用的统计功能。 例如,给出标准正态分布的累积密度函数(Then you are able to use some useful statistical function. For example, the cummulative density function of a standard normal distribution is given like

Statistics-in-Scipy

  • 这个包,我们可以直接使用它,如下: (with this package, we can directly use it like)
from scipy import stats
y = stats.norm.cdf(1.2)

优化:数据拟合 (Optimisation: Data  fitting)

import numpy as np
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt

def func(x, a, b, c):    
    return a * np.exp(-b * x) + c

x = np.linspace(0, 4, 50)
y = func(x, 2.5, 1.3, 0.5)
ydata = y+0.2*np.random.normal(size=len(x))
popt, pcov = curve_fit(func, x, ydata)
plt.plot(x, ydata, 'b*')
plt.plot(x, func(x, popt[0], \
                    popt[1], popt[2]), 'r-')
plt.title('$f(x)=ae^{-bx}+c$ curve fitting')

data-fitting

优化:根搜索 (Optimisation: Root searching)

import numpy as np
from scipy import optimize

def fun(x):
    return np.exp(np.exp(x)) - x**2

# 通过初始化点0,找到兴趣0 (find zero of fun with initial point 0)
# 通过Newton-Raphson方法 (by Newton-Raphson)
value1 = optimize.newton(fun, 0)

# 通过二分法找到介于(-5,5)之间的 (find zero between (-5,5) by bisection)
value2 = optimize.bisect(fun, -5, 5)

Matplotlib

最简单的制图 (The simplest plot)

  • 导入库需要添加以下内容
from matplotlib import pyplot as plt
  • 为了绘制一个函数,我们操作如下 (To plot a function, we do:)
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 10, 201)
#y = x ** 0.5
#plt.plot(x, y) # default plot
plt.figure(figsize = (3, 3)) # new fig
plt.plot(x, x**0.3, 'r--') # red dashed
plt.plot(x, x-1, 'k-') # continue plot
plt.plot(x, np.zeros_like(x), 'k-')
  • 注意:您的x轴在plt.plot函数中应与y轴的尺寸相同。 (Note: Your x-axis should be the same dimension to y-axis in plt.plot function.)

the simplest plot

多个制图图例标签和标题 (Multiple plotting, legends, labels and title)

import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 10, 201)
plt.figure(figsize = (4, 4))
for n in range(2, 5):
    y = x ** (1 / n)
    plt.plot(x, y, label='x^(1/' \
            + str(n) + ')')
plt.legend(loc = 'best')
plt.xlabel('X axis')
plt.ylabel('Y axis')
plt.xlim(-2, 10)
plt.title('Multi-plot e.g. ', fontsize = 18)

multiple-plotting

  • Forinformations:See
help(plt.plot)  

绘制子图 

import numpy as np
import matplotlib.pyplot as plt

def pffcall(S, K):    
    return np.maximum(S - K, 0.0)
def pffput(S, K):
    return np.maximum(K - S, 0.0)    

S = np.linspace(50, 151, 100)
fig = plt.figure(figsize=(12, 6))  

sub1 = fig.add_subplot(121)     # col, row, num    
sub1.set_title('Call', fontsize = 18)
plt.plot(S, pffcall(S, 100), 'r-', lw = 4)
plt.plot(S, np.zeros_like(S), 'black',lw = 1)
sub1.grid(True)
sub1.set_xlim([60, 120])
sub1.set_ylim([-10, 40])    

sub2 = fig.add_subplot(122)
sub2.set_title('Put', fontsize = 18)
plt.plot(S, pffput(S, 100), 'r-', lw = 4)
plt.plot(S, np.zeros_like(S), 'black',lw = 1)
sub2.grid(True)
sub2.set_xlim([60, 120])
sub2.set_ylim([-10, 40])  

multiple_plottion

  • Figure: 一个子图的例子 (注释:这里,可以把Figure,即fig理解为一张大画布,你把它分成了两个子区域(sub1和sub2),然后在每个子区域各画了一幅图。)

 在绘制的图上添加文本和注释 (Adding texts to plots)

import numpy as np
from scipy.stats import norm
import matplotlib.pyplot as plt

def call(S, K=100, T=0.5, vol=0.6, r=0.05):
    d1 = (np.log(S/K) + (r + 0.5 * vol**2) \
          *T) / np.sqrt(T) / vol
    d2 = (np.log(S/K) + (r - 0.5 * vol**2) \
          *T) / np.sqrt(T) / vol
    return S * norm.cdf(d1) - K * \
    np.exp(-r * T) * norm.cdf(d2)

def delta(S, K=100, T=0.5, vol=0.6, r=0.05):
    d1 = (np.log(S/K) + (r + 0.5 * vol**2)\
          *T) / np.sqrt(T) / vol
    return norm.cdf(d1)

(Code continues:)

S = np.linspace(40, 161, 100)
fig = plt.figure(figsize=(7, 6))
ax = fig.add_subplot(111)
plt.plot(S,(call(S)-call(100)),'r',lw=1)
plt.plot(100, 0, 'ro', lw=1)
plt.plot(S,np.zeros_like(S), 'black', lw = 1)
plt.plot(S,call(S)-delta(100)*S- \
    (call(100)-delta(100)*100), 'y', lw = 1)

(Code continues:)

ax.annotate('$\Delta$ hedge', xy=(100, 0), \
            xytext=(110, -10),arrowprops= \
            dict(headwidth =3,width = 0.5, \
            facecolor='black', shrink=0.05))
ax.annotate('Original call', xy= \
            (120,call(120)-call(100)),xytext\
            =(130,call(120)-call(100)),\
            arrowprops=dict(headwidth =10,\
            width = 3, facecolor='cyan', \
            shrink=0.05))
plt.grid(True)
plt.xlim(40, 160)
plt.xlabel('Stock price', fontsize = 18)
plt.ylabel('Profits', fontsize = 18)

annotation

3D plot of a function with 2 variables

import numpy as np
import matplotlib.pyplot as plt
from matplotlib import cm
from mpl_toolkits.mplot3d import Axes3D

x, y = np.mgrid[-5:5:100j, -5:5:100j]
z = x**2 + y**2
fig = plt.figure(figsize=(8, 6))
ax = plt.axes(projection='3d')
surf = ax.plot_surface(x, y, z, rstride=1,\
                       cmap=cm.coolwarm, cstride=1, \
                       linewidth=0)
fig.colorbar(surf, shrink=0.5, aspect=5)
plt.title('3D plot of $z = x^2 + y^2$')



实验3:atplotlib   (Lab 3: Matplotlib)

  • 用蓝线绘制以下函数 (Plot the following function with blue line)

 

  • 然后用红点标记座标(1,2) (Then mark the coordinate (1, 2) with a red point.)
  • 使用np.linspace()使t ∈ [0,2π]。 然后给 (Use np.linspace0 to make t ∈ [0,2π]. Then give)

  

  • 针对X绘Y。 在这个情节中添加一个称为“Heart”的标题。 (Plot y against x. Add a title to this plot which is called "Heart" .)
  • 针对x∈[-10,10], y∈[-10,10], 绘制3D函数 (Plot the 3D function for x∈[-10,10], y∈[-10,10])

  

Sympy

符号计算 (Symbolic computation)

  • 到目前为止,我们只考虑了数值计算。 (So far, we only considered the numerical computation.)

  • Python也可以通过模块表征进行符号计算。(Python can also work with symbolic computation via  module sympy.)

  • 符号计算可用于计算方程,积分等的显式解。 (Symbolic computation can be useful for calculating explicit solutions to equations, integrations and so on.)

声明一个符号变量 (Declare a symbol variable)

import sympy as sy

#声明x,y为变量
x = sy.Symbol('x')
y = sy.Symbol('y')
a, b = sy.symbols('a b')

#创建一个新符号(不是函数
f = x**2 + 2 - 2*x + x**2 -1
print(f)
#自动简化
g = x**2 + 2 - 2*x + x**2 -1
print(g)

符号的使用1:求解方程 (Use of symbol 1: Solve equations)

import sympy as sy

x  = sy.Symbol ('x')
y  = sy.Symbol('y')

# 给定[-1,1]  (give [-1, 1])
print(sy.solve (x**2 - 1))

# 不能证解决 (no guarantee for solution)
print(sy.solve(x**3  +  0.5*x**2 - 1))

# 用x的表达式表示y     (exepress x in terms of y)
print (sy.solve(x**3  +  y**2))

# 错误:找不到算法 (error:  no  algorithm  can  be  found)
print(sy.solve(x**x + 2*x - 1))

符号的使用2:集成  (Use of symbol 2: Integration)  

import sympy as sy

x = sy.Symbol('x')
y = sy.Symbol( 'y')
b = sy.symbols ( 'a b')

# 单变量 single  variable
f = sy.sin(x) + sy.exp(x)
print(sy.integrate(f, (x,  a,  b)))
print(sy.integrate(f, (x,  12)))
print(sy.integrate(f, (x,  1.0,2.0)))
# 多变量 multi variables
g = sy.exp(x) + x * sy.sin(y)
print(sy.integrate(g, (y,a,b)))

符号的使用3:分化  (Use of symbol 3: Differentiation)

import sympy as sy
x =  sy.Symbol( 'x')
y =  sy.Symbol( 'y')
# 单变量 (single variable)
f = sy.cos(x) + x**x
print(sy . diff (f ,  x))
#  多变量  (multi variables)
g = sy.cos(y) * x + sy.log(y)
print(sy.diff (g,  y))
第二天的内容结束,第三天传送门>>>
                              
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章