numpy常用方法

原創

野孩子1991

2018-08-24 14:31

假设：

import scipy.io as scio
import operator
import numpy as np

1.求平均值 mean

array1.mean(axis=0) == numpy.mean(array1, axis=0)

Examples
--------
>>> a = np.array([[1, 2], [3, 4]])
>>> np.mean(a)
2.5
>>> np.mean(a, axis=0)
array([ 2., 3.])
>>> np.mean(a, axis=1)
array([ 1.5, 3.5])

axis=0 对列求平均值。

2.求方差 std

array1.std(axis=0) == numpy.std(array1, axis=0)

axis的意义同1，求方差。

3.numpy scipy pandas 区别

NumPy 是基础的数学计算库，包括基本的四则运行，方程式计算，微积分什么的，还有很多其他数学方面的计算，我也不是很清楚
SciPy ：是在NumPy基础上，封装了一层，没有那么纯数学，提供方法直接计算结果
Pandas 就是上层做数据分析用的，主要是做表格数据呈现
如果不是纯数学专业还是从 Pandas 入手比较好。

4.读.mat文件 loadmat

scio.loadmat(train_data_file) 
# return is a dict

5.求几次方 **

diff ** 2 
# 2次方，2换成0.5就是开方 diff 可数字和数组

6.数组求和 sum

diff.sum(axis=1)
# 求数组的和， axis的值同上 0是列； 1是行； diff 数组

7.排序下标 argsort

diff.argsort(axis=1)
# diff数组从小到大数据的下标 axis同上，默认是1
examples：
>>> a = np.array([[1, 2], [3, 4]])
>>> a.argsort()
array([[0, 1],
[0, 1]])
# 输出数组行从小到大排序的原始数据座标；
# 如，index=0行的1,2 从小到大排序还是 1 2 ，1原来数组的下标是0; 2原来数组的下标是1 ； 因此返回数据的第一行是0 1

8.dict get

class_count.get(label, 0) 
# class_count 是一个 dict 。 从class_count找key = label对应的value，找到就返回value，找不到就返回0。

9.dict排序 sorted

sorted_class_count = sorted(class_count.iteritems(), key=operator.itemgetter(1), reverse=True）
# 对字典的value排序，返回一个list，list里包含很多元组，这些元组就是之前dict的key-value对儿。
# class_count 是一个 dict 。 reverse=True致使value是从大到小的顺序。
# sorted_class_count[][]

10.统计次数 bincount

>>> a = np.array([1, 2, 3, 2])
>>> np.bincount(a)
array([0, 1, 2, 1])
# 对数组中数据统计次数；返回数组下标是原始数组的值，返回数组的数据值是次数。
# 输入数组使用中发现的约束条件：一维数组、 必须是int整形。

11.最大/小值max、最大/小值的下标argmax

12. np.random.uniform（start， end， size）

生成一个数值均匀分布在start，end间的长度大小是size的数组（ndarray类型）。注意是>= start && < end ，前闭后开。

13.np的flatten() vs ravel()

两者都是把多维矩阵铺平，以行为主。区别是flatten返回的是原矩阵的拷贝；ravel是返回的是原矩阵的一种变换视图，如果对返回值修改原矩阵也会跟着变化。

>>> a
array([[1, 2, 3],
[3, 2, 2],
[3, 4, 5],
[2, 3, 2]])
>>> b = a.flatten()
>>> b[0] = 0
>>> a #原矩阵没有变化
array([[1, 2, 3],
[3, 2, 2],
[3, 4, 5],
[2, 3, 2]])
>>> c = a.ravel()
>>> c[0] = 0
>>> a #原矩阵变化
array([[0, 2, 3],
[3, 2, 2],
[3, 4, 5],
[2, 3, 2]])

14. np.mgrid 生成网格

# np.mgrid[start: end: size/seperate]
原本是生成一个[start, end)的表格，分割大小是seperate；第三个参数后面有j时表示生成一个[start, end]的表格，表格大小是size：
>>> np.mgrid[-10:10:5j] # 有‘j’。生成大小是5的分布在[-10, 10]的表格
array([-10., -5., 0., 5., 10.])
>>> np.mgrid[-10:10:5] # 用5分割[-10, 10)， 生成一个表格。
array([-10, -5, 0, 5])
>>> arr1, arr2 = np.mgrid[-10:10:5, -10:10:5j] # arr1，arr2铺平 再stack ，可以很好的作为二位座标数据。
>>> arr1
array([[-10., -10., -10., -10., -10.],
[ -5., -5., -5., -5., -5.],
[ 0., 0., 0., 0., 0.],
[ 5., 5., 5., 5., 5.]])
>>> arr2
array([[-10., -5., 0., 5., 10.],
[-10., -5., 0., 5., 10.],
[-10., -5., 0., 5., 10.],
[-10., -5., 0., 5., 10.]])

15. np.amin/amax == np.min/max

16.np.vstack(tuple) np.hstack(tuple) np.concatenate(tuple) np.stack()

tuple是一个arrays，就是由多个矩阵组成。
hstack(tuple) 是把多个矩阵以行拼接，等同于np.concatenate(tuple, axis=1)
vstack(tuple) 是把多个矩阵以列拼接，等同于np.concatenate(tuple, axis=0)

>>> a = np.array([[1,2,3], [2,3,4]])
>>> b = np.array([[2,3,9], [2,6,4]])
>>> np.hstack((a, b))
array([[1, 2, 3, 2, 3, 9],
[2, 3, 4, 2, 6, 4]])
>>> np.concatenate((a,b), axis = 1)
array([[1, 2, 3, 2, 3, 9],
[2, 3, 4, 2, 6, 4]])

>>> np.vstack((a, b))
array([[1, 2, 3],
[2, 3, 4],
[2, 3, 9],
[2, 6, 4]])
>>> np.concatenate((a,b), axis = 0)
array([[1, 2, 3],
[2, 3, 4],
[2, 3, 9],
[2, 6, 4]])


>>> np.stack((a, b), axis=0)
array([[[1, 2, 3],
[2, 3, 4]],

[[2, 3, 9],
[2, 6, 4]]])
>>> np.stack((a, b), axis=1)
array([[[1, 2, 3],
[2, 3, 9]],

[[2, 3, 4],
[2, 6, 4]]])

17. np.transpose(元组) 和 T

transpose适用于多维数组，它依赖与参数元组，元组依赖与 shape。
T用于一/二维数组。

18、:, 代表一个维度的切片

eg：

img = io.imread(img_path)
data = np.zeros((3, img.shape[0], img.shape[1]), dtype=np.uint8)
data[0] = img[:, :, 0]
data[1] = img[:, :, 1]
data[2] = img[:, :, 2]

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.