我的编程空间,编程开发者的网络收藏夹
学习永远不晚

python3-numpy

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

python3-numpy

参考地址:

1、https://www.shiyanlou.com/courses/912

2、https://www.shiyanlou.com/courses/348

3、https://docs.scipy.org/doc/numpy/reference/

4、https://docs.scipy.org/doc/numpy/user/index.html#user

5、http://scipy.github.io/old-wiki/pages/Tentative_NumPy_Tutorial

6、https://docs.scipy.org/doc/numpy-dev/user/quickstart.html

 

 

Python 本身支持的数值类型有 int(整型,python2 中存在 long 长整型)、float(浮点型)、bool(布尔型) 和 complex(复数型)。

而 Numpy 支持比 Python 本身更为丰富的数值类型,细分如下:

  1. bool:布尔类型,1 个字节,值为 True 或 False。
  2. int:整数类型,通常为 int64 或 int32 。
  3. intc:与 C 里的 int 相同,通常为 int32 或 int64。
  4. intp:用于索引,通常为 int32 或 int64。
  5. int8:字节(从 -128 到 127)
  6. int16:整数(从 -32768 到 32767)
  7. int32:整数(从 -2147483648 到 2147483647)
  8. int64:整数(从 -9223372036854775808 到 9223372036854775807)
  9. uint8:无符号整数(从 0 到 255)
  10. uint16:无符号整数(从 0 到 65535)
  11. uint32:无符号整数(从 0 到 4294967295)
  12. uint64:无符号整数(从 0 到 18446744073709551615)
  13. float:float64 的简写。
  14. float16:半精度浮点,5 位指数,10 位尾数
  15. float32:单精度浮点,8 位指数,23 位尾数
  16. float64:双精度浮点,11 位指数,52 位尾数
  17. complex:complex128 的简写。
  18. complex64:复数,由两个 32 位浮点表示。
  19. complex128:复数,由两个 64 位浮点表示。

在 Numpy 中,上面提到的这些数值类型都被归于 dtype(data-type) 对象的实例。

我们可以用 numpy.dtype(object, align, copy) 来指定数值类型。而在数组里面,可以用 dtype= 参数。

 



 
  1. import numpy as np

  2.  
  3. a = np.array([1.1, 2.2, 3.3], dtype=np.float64) # 指定 1 维数组的数值类型为 float64


另外,你可以使用 .astype() 方法在不同的数值类型之间相互转换。

 

 


a.astype(int) # 将 a 的数值类型从 float64 转换为 int

 

最后,你可以使用 .dtype 来查看 dtype 属性。

 


a.dtype # 查看 a 的数值类型

 

2、Numpy 多维数组

2.1 ndarray 介绍

 

在 python 内建对象中,数组有三种形式:

  1. list 列表:[1, 2, 3]
  2. Tuple 元组:(1, 2, 3, 4, 5)
  3. Dict 字典:{A:1, B:2}

Numpy 最核心且最重要的一个特性就是 ndarray 多维数组对象,它区别于 python 的标准类,拥有对高维数组的处理能力,这也是数值计算过程中缺一不可的重要特性。

Numpy 中,ndarray 类具有六个参数,它们分别为:

  1. shape:数组的形状。
  2. dtype:数据类型。
  3. buffer:对象暴露缓冲区接口。
  4. offset:数组数据的偏移量。
  5. strides:数据步长。
  6. order{'C','F'},以行或列为主排列顺序。

下面,我们来了解创建 ndarray 的一些方法。在 numpy 中,我们主要通过以下 5 种途径创建数组,它们分别是:

  1. 从 Python 数组结构列表,元组等转换。
  2. 使用 np.arange、np.ones、np.zeros 等 numpy 原生方法。
  3. 从存储空间读取数组。
  4. 通过使用字符串或缓冲区从原始字节创建数组。
  5. 使用特殊函数,如 random。

2.2 从列表或元组转换

在 numpy 中,我们使用 numpy.array 将列表或元组转换为 ndarray 数组。其方法为:

 


numpy.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)

 

其中,参数:

  • object:列表、元组等。
  • dtype:数据类型。如果未给出,则类型为被保存对象所需的最小类型。
  • copy:布尔来写,默认 True,表示复制对象。
  • order:顺序。
  • subok:布尔类型,表示子类是否被传递。
  • ndmin:生成的数组应具有的最小维数。

下面,通过列表创建一个 ndarray 数组:



 
  1. import numpy as np

  2.  
  3. np.array([[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]]])


或者是列表和元组:



 
  1. import numpy as np

  2.  
  3. np.array([(1,2),(3,4),(5,6)])

 

2.3 arange 方法创建

除了直接使用 array 方法创建 ndarray,在 numpy 中还有一些方法可以创建一些有规律性的多维数。首先,我们来看一看 arange()。arange() 的功能是在给定区间内创建一系列均匀间隔的值。方法如下:


numpy.arange(start, stop, step, dtype=None)

你需要先设置值所在的区间,这里为 `[开始, 停止),你应该能发现这是一个半开半闭区间。然后,在设置 step 步长用于设置值之间的间隔。最后的可选参数 dtype可以设置返回ndarray 的值类型。

举个例子:

 



 
  1. import numpy as np

  2.  
  3. # 在区间 [3, 7) 中以 0.5 为步长新建数组

  4. np.arange(3, 7, 0.5, dtype='float32')

  5.  
  6. # array([ 3. , 3.5, 4. , 4.5, 5. , 5.5, 6. , 6.5], dtype=float32)

 

2.4 linspace 方法创建

linspace方法也可以像arange方法一样,创建数值有规律的数组。linspace 用于在指定的区间内返回间隔均匀的值。其方法如下:

 

 


numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

 

  • start:序列的起始值。
  • stop:序列的结束值。
  • num:生成的样本数。默认值为50。
  • endpoint:布尔值,如果为真,则最后一个样本包含在序列内。
  • retstep:布尔值,如果为真,返回间距。
  • dtype:数组的类型。

 

举个例子:



 
  1. np.linspace(0, 10, 10, endpoint=True)

  2.  
  3. # array([ 0. , 1.11111111, 2.22222222, 3.33333333,

  4. 4.44444444, 5.55555556, 6.66666667, 7.77777778,

  5. 8.88888889, 10. ])

  6. np.linspace(0, 10, 10, endpoint=False)

  7.  
  8. # array([ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

 

2.5 ones 方法创建

 

numpy.ones 用于快速创建数值全部为 1 的多维数组。其方法如下:


numpy.ones(shape, dtype=None, order='C')

 

其中:

  • shape:用于指定数组形状,例如(1, 2)或 3。
  • dtype:数据类型。
  • order{'C','F'},按行或列方式储存数组。

举个例子:



 
  1. import numpy as np

  2.  
  3. print(np.ones((2,3)))

  4. """

  5. [[ 1. 1. 1.]

  6. [ 1. 1. 1.]]

  7. """

 

2.6 zeros 方法创建

 

zeros 方法和上面的 ones 方法非常相似,不同的地方在于,这里全部填充为 0。zeros 方法和 ones 是一致的。


numpy.zeros(shape, dtype=None, order='C')

其中:

  • shape:用于指定数组形状,例如(1, 2)3
  • dtype:数据类型。
  • order{'C','F'},按行或列方式储存数组。

举个例子:

 



 
  1. import numpy as np

  2.  
  3. print(np.zeros((3,2)))

  4. '''

  5. [[ 0. 0.]

  6. [ 0. 0.]

  7. [ 0. 0.]]

  8. '''

 

2.7 eye 方法创建

numpy.eye 用于创建一个二维数组,其特点是k 对角线上的值为 1,其余值全部为0。方法如下:


numpy.eye(N, M=None, k=0, dtype=<type 'float'>)

 

其中:

  • N:输出数组的行数。
  • M:输出数组的列数。
  • k:对角线索引:0(默认)是指主对角线,正值是指上对角线,负值是指下对角线。

举个例子:



 
  1. import numpy as np

  2.  
  3.  
  4. print(np.eye(5, 4, 3))

  5. '''

  6. [[ 0. 0. 0. 1.]

  7. [ 0. 0. 0. 0.]

  8. [ 0. 0. 0. 0.]

  9. [ 0. 0. 0. 0.]

  10. [ 0. 0. 0. 0.]]

  11. '''

  12. print(np.eye(5, 4, 0))

  13. '''

  14. [[ 1. 0. 0. 0.]

  15. [ 0. 1. 0. 0.]

  16. [ 0. 0. 1. 0.]

  17. [ 0. 0. 0. 1.]

  18. [ 0. 0. 0. 0.]]

  19. '''

  20. print(np.eye(5, 4, -1))

  21. '''

  22. [[ 0. 0. 0. 0.]

  23. [ 1. 0. 0. 0.]

  24. [ 0. 1. 0. 0.]

  25. [ 0. 0. 1. 0.]

  26. [ 0. 0. 0. 1.]]

  27. '''

2.8 从已知数据创建

我们还可以从已知数据文件、函数中创建 ndarray。numpy 提供了下面 5 个方法:

  1. frombuffer(buffer):将缓冲区转换为 1 维数组。
  2. fromfile(file,dtype,count,sep):从文本或二进制文件中构建多维数组。
  3. fromfunction(function,shape):通过函数返回值来创建多维数组。
  4. fromiter(iterable,dtype,count):从可迭代对象创建 1 维数组。
  5. fromstring(string,dtype,count,sep):从字符串中创建 1 维数组。

举个例子:



 
  1. import numpy as np

  2.  
  3. print(np.fromfunction(lambda a, b: a + b, (5, 4)))

  4. """

  5. [[ 0. 1. 2. 3.]

  6. [ 1. 2. 3. 4.]

  7. [ 2. 3. 4. 5.]

  8. [ 3. 4. 5. 6.]

  9. [ 4. 5. 6. 7.]]

  10. """

2.9 linspace 与 logspace

 



 
  1. # using linspace, both end points ARE included

  2. linspace(0, 10, 25)

  3.  
  4. => array([ 0. , 0.41666667, 0.83333333, 1.25 ,

  5. 1.66666667, 2.08333333, 2.5 , 2.91666667,

  6. 3.33333333, 3.75 , 4.16666667, 4.58333333,

  7. 5. , 5.41666667, 5.83333333, 6.25 ,

  8. 6.66666667, 7.08333333, 7.5 , 7.91666667,

  9. 8.33333333, 8.75 , 9.16666667, 9.58333333, 10. ])

  10.  
  11.  
  12.  
  13.  
  14. logspace(0, 10, 10, base=e)

  15.  
  16. => array([ 1.00000000e+00, 3.03773178e+00, 9.22781435e+00,

  17. 2.80316249e+01, 8.51525577e+01, 2.58670631e+02,

  18. 7.85771994e+02, 2.38696456e+03, 7.25095809e+03,

  19. 2.20264658e+04])

 

 

2.10 mgrid

 



 
  1. x, y = mgrid[0:5, 0:5] # similar to meshgrid in MATLAB

  2. x

  3.  
  4. => array([[0, 0, 0, 0, 0],

  5. [1, 1, 1, 1, 1],

  6. [2, 2, 2, 2, 2],

  7. [3, 3, 3, 3, 3],

  8. [4, 4, 4, 4, 4]])

  9.  
  10. y

  11.  
  12. => array([[0, 1, 2, 3, 4],

  13. [0, 1, 2, 3, 4],

  14. [0, 1, 2, 3, 4],

  15. [0, 1, 2, 3, 4],

  16. [0, 1, 2, 3, 4]])

 

2.11 diag

 



 
  1. # a diagonal matrix

  2. diag([1,2,3])

  3.  
  4. => array([[1, 0, 0],

  5. [0, 2, 0],

  6. [0, 0, 3]])

  7.  
  8. # diagonal with offset from the main diagonal

  9. diag([1,2,3], k=1)

  10.  
  11. => array([[0, 1, 0, 0],

  12. [0, 0, 2, 0],

  13. [0, 0, 0, 3],

  14. [0, 0, 0, 0]])

 

2.12 文件 I/O 创建数组

 

2.12.1CSV

CSV是一种常用的数据格式化文件类型,为了从中读取数据,我们使用 numpy.genfromtxt 函数。

 

 



 
  1. # wget http://labfile.oss.aliyuncs.com/courses/348/stockholm_td_adj.dat

  2. import numpy as np

  3.  
  4. data = np.genfromtxt('stockholm_td_adj.dat')

  5. print(data.shape) # (77431, 7)

  6.  
  7. data = np.loadtxt('stockholm_td_adj.dat')

  8. print(data.shape) # (77431, 7)

  9.  
  10. data = np.mafromtxt('stockholm_td_adj.dat')

  11. print(data.shape) # (77431, 7)

  12.  
  13. data = np.ndfromtxt('stockholm_td_adj.dat')

  14. print(data.shape) # (77431, 7)

  15.  
  16. data = np.recfromtxt('stockholm_td_adj.dat')

  17. print(data.shape) # (77431, )


使用 numpy.savetxt 我们可以将 Numpy 数组保存到csv文件中:

 

 



 
  1. M = random.rand(3,3)

  2. M

  3.  
  4. => array([[ 0.70506801, 0.54618952, 0.31039856],

  5. [ 0.26640475, 0.10358152, 0.73231132],

  6. [ 0.07987128, 0.34462854, 0.91114433]])

  7.  
  8. savetxt("random-matrix.csv", M)

  9.  
  10. !cat random-matrix.csv

  11.  
  12. => 7.050680113576863750e-01 5.461895177867910345e-01 3.103985627238065037e-01

  13. 2.664047486311884594e-01 1.035815249084012235e-01 7.323113219935466489e-01

  14. 7.987128326702574999e-02 3.446285401590922781e-01 9.111443300153220237e-01

  15.  
  16.  
  17.  
  18. savetxt("random-matrix.csv", M, fmt='%.5f') # fmt specifies the format

  19.  
  20. !cat random-matrix.csv

  21.  
  22. => 0.70507 0.54619 0.31040

  23. 0.26640 0.10358 0.73231

  24. 0.07987 0.34463 0.91114

 

 

2.12.2 Numpy 原生文件类型

使用 numpy.save 与 numpy.load 保存和读取:

 



 
  1. save("random-matrix.npy", M)

  2.  
  3. !file random-matrix.npy

  4.  
  5. => random-matrix.npy: data

  6.  
  7. load("random-matrix.npy")

  8.  
  9. => array([[ 0.70506801, 0.54618952, 0.31039856],

  10. [ 0.26640475, 0.10358152, 0.73231132],

  11. [ 0.07987128, 0.34462854, 0.91114433]])


 

 



 
  1. import numpy as np

  2.  
  3. a = np.array([[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]]])

  4. print(a)

  5. '''

  6. [[[1 2 3]

  7. [1 2 3]

  8. [1 2 3]]

  9.  
  10. [[1 2 3]

  11. [1 2 3]

  12. [1 2 3]]

  13.  
  14. [[1 2 3]

  15. [1 2 3]

  16. [1 2 3]]]

  17. '''


ndarray 多维数组支持下面这些属性:

3.1 ndarray.T

ndarray.T用于数组的转置,与 .transpose() 相同。

 



 
  1. import numpy as np

  2.  
  3. a.T

 

3.2 ndarray.dtype

 

ndarray.dtype 用来输出数组包含元素的数据类型。



 
  1. import numpy as np

  2.  
  3. a.dtype

3.3ndarray.imag

ndarray.imag 用来输出数组包含元素的虚部。

 



 
  1. import numpy as np

  2.  
  3. a = np.array([[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]],[[1, 2, 3],[1, 2, 3],[1, 2, 3]]])

  4.  
  5. print(a.imag)

  6. '''

  7. [[[0 0 0]

  8. [0 0 0]

  9. [0 0 0]]

  10.  
  11. [[0 0 0]

  12. [0 0 0]

  13. [0 0 0]]

  14.  
  15. [[0 0 0]

  16. [0 0 0]

  17. [0 0 0]]]

  18. '''

 

3.4ndarray.real

 

ndarray.real用来输出数组包含元素的实部。



 
  1. import numpy as np

  2.  
  3. a.real

3.5 ndarray.size

ndarray.size用来输出数组中的总包含元素数。

 



 
  1. import numpy as np

  2.  
  3. a.size

 

 

3.6ndarray.itemsize

 

ndarray.itemsize输出一个数组元素的字节数。



 
  1. import numpy as np

  2.  
  3. a.itemsize # 8

3.7 ndarray.nbytes

ndarray.nbytes用来输出数组的元素总字节数。



 
  1. import numpy as np

  2.  
  3. a.nbytes # 216=8*3*3*3

 

3.8 ndarray.ndim

ndarray.ndim用来输出数组尺寸。



 
  1. import numpy as np

  2.  
  3. a.ndim # 3

3.9 ndarray.shape

ndarray.shape用来输出数组维数组.



 
  1. import numpy as np

  2.  
  3. a.shape # (3,3,3)

3.10 ndarray.strides

ndarray.strides用来遍历数组时,输出每个维度中步进的字节数组。



 
  1. import numpy as np

  2.  
  3. a.strides # (72,24,8)


 

4.1 重设形状

reshape 可以在不改变数组数据的同时,改变数组的形状。其中,numpy.reshape() 等效于 ndarray.reshape()reshape方法非常简单:

 


numpy.reshape(a, newshape)

 

其中,a 表示原数组,newshape 用于指定新的形状(整数或者元组)。

举个例子:

 



 
  1. import numpy as np

  2.  
  3. print(np.arange(10).reshape((5, 2)))

  4. '''

  5. [[0 1]

  6. [2 3]

  7. [4 5]

  8. [6 7]

  9. [8 9]]

  10. '''

 

4.2 数组展开

 

ravel 的目的是将任意形状的数组扁平化,变为 1 维数组。ravel 方法如下:

 


numpy.ravel(a, order='C')

 

其中,a 表示需要处理的数组。order 表示变换时的读取顺序,默认是按照行依次读取,当 order='F' 时,可以按列依次读取排序。

示例:



 
  1. import numpy as np

  2.  
  3. a = np.arange(10).reshape((2, 5))

  4. print(a)

  5. '''

  6. [[0 1 2 3 4]

  7. [5 6 7 8 9]]

  8. '''

  9. print(np.ravel(a)) # [0 1 2 3 4 5 6 7 8 9]

  10. print(np.ravel(a, order='F')) # [0 5 1 6 2 7 3 8 4 9]

  11.  
  12. print(a.flatten()) # [0 1 2 3 4 5 6 7 8 9]

4.3 轴移动

moveaxis 可以将数组的轴移动到新的位置。其方法如下:

 


numpy.moveaxis(a, source, destination)

 

其中:

  • a:数组。
  • source:要移动的轴的原始位置。
  • destination:要移动的轴的目标位置。

举个例子:



 
  1. import numpy as np

  2.  
  3. a = np.ones((1, 2, 3)) # (1,2,3)

  4. print(a)

  5. '''

  6. [[[ 1. 1. 1.]

  7. [ 1. 1. 1.]]]

  8. '''

  9. b=np.moveaxis(a, 0, -1) # 等价于 a.transpose((1,2,0))

  10. print(b)

  11. '''

  12. [[[ 1.]

  13. [ 1.]

  14. [ 1.]]

  15.  
  16. [[ 1.]

  17. [ 1.]

  18. [ 1.]]]

  19. '''

  20. print(b.shape) # (2, 3, 1)

  21.  
  22. c=a.transpose((1,2,0))

  23. print(c)

  24. '''

  25. [[[ 1.]

  26. [ 1.]

  27. [ 1.]]

  28.  
  29. [[ 1.]

  30. [ 1.]

  31. [ 1.]]]

  32. '''

4.4 轴交换

和 moveaxis 不同的是,swapaxes 可以用来交换数组的轴。其方法如下:


numpy.swapaxes(a, axis1, axis2)

其中:

  • a:数组。
  • axis1:需要交换的轴 1 位置。
  • axis2:需要与轴 1 交换位置的轴 1 位置。

举个例子:



 
  1. import numpy as np

  2.  
  3. a = np.ones((1, 4, 3)) # (1,4,3)

  4. print(a)

  5. b=np.swapaxes(a, 0, 2) # (3,4,1) 等价于 np.transpose(a,(2,1,0)) 和 np.moveaxis(np.moveaxis(a,0,-1),0,1)

  6. print(b)

 

4.5 数组转置

transpose 类似于矩阵的转置,它可以将 2 维数组的横轴和纵轴交换。其方法如下:

 


numpy.transpose(a, axes=None)

 

其中:

  • a:数组。
  • axis:该值默认为 none,表示转置。如果有值,那么则按照值替换轴。

举个例子:

 



 
  1. import numpy as np

  2.  
  3. a = np.arange(4).reshape(2,2)

  4. print(a)

  5. '''

  6. [[0 1]

  7. [2 3]]

  8. '''

  9. print(np.transpose(a)) # 等价于np.transpose(a,(1,0))

  10. '''

  11. [[0 2]

  12. [1 3]]

  13. '''

 



 
  1. import numpy as np

  2.  
  3. a = np.arange(8).reshape(2,2,2)

  4. print(a[:,0,:],a[:,1,:])

  5. '''

  6. [[0 1]

  7. [4 5]] [[2 3]

  8. [6 7]]

  9. '''

  10. c=np.transpose(a,(1,0,2))

  11. print(c[0,:,:],c[1,:,:])

  12. '''

  13. [[0 1]

  14. [4 5]] [[2 3]

  15. [6 7]]

  16. '''

 

 

4.6 维度改变

 

atleast_xd 支持将输入数据直接视为 x维。这里的 x 可以表示:1,2,3。方法分别维:



 
  1. numpy.atleast_1d()

  2. numpy.atleast_2d()

  3. numpy.atleast_3d()


举个例子:

 



 
  1. import numpy as np

  2.  
  3. a=[1,2,3,4]

  4.  
  5. print(np.atleast_1d(a)) # [1 2 3 4]

  6. print(np.atleast_2d(a)) # [[1 2 3 4]]

  7. print(np.atleast_3d(a))

  8. '''

  9. [[[1]

  10. [2]

  11. [3]

  12. [4]]]

  13. '''

 

 

 

 

4.7 类型转变

 

在 numpy 中,还有一系列以 as 开头的方法,它们可以将特定输入转换为数组,亦可将数组转换为矩阵、标量,ndarray等。如下:

  • asarray(a,dtype,order):将特定输入转换为数组。
  • asanyarray(a,dtype,order):将特定输入转换为 ndarray
  • asmatrix(data,dtype):将特定输入转换为矩阵。
  • asfarray(a,dtype):将特定输入转换为 float 类型的数组。
  • asarray_chkfinite(a,dtype,order):将特定输入转换为数组,检查 NaN 或 infs
  • asscalar(a):将大小为 1 的数组转换为标量。

这里以 asmatrix(data,dtype) 方法举例:



 
  1. import numpy as np

  2.  
  3. a = np.arange(4).reshape(2,2)

  4. np.asmatrix(a)

 

4.8 数组连接

concatenate 可以将多个数组沿指定轴连接在一起。其方法为:

 


numpy.concatenate((a1, a2, ...), axis=0)

 

其中:

  • (a1, a2, ...):需要连接的数组。
  • axis:指定连接轴。

举个例子:

 



 
  1. import numpy as np

  2.  
  3. a = np.array([[1, 2], [3, 4], [5, 6]]) # (3,2)

  4. b = np.array([[7, 8], [9, 10]]) # (2,2)

  5. c = np.array([[11, 12]]) # (1,2)

  6.  
  7. d=np.concatenate((a, b, c), axis=0) # axis=0 按第1维 连接

  8. print(d.shape) # (6, 2)

这里,我们可以尝试沿着横轴连接。但要保证连接处的维数一致,所以这里用到了 .T 转置。



 
  1. import numpy as np

  2.  
  3. a = np.array([[1, 2], [3, 4], [5, 6]]) # (3,2)

  4. b = np.array([[7, 8, 9]]) # (1,3)

  5.  
  6. print(np.concatenate((a, b.T), axis=1).shape) # (3,3)

 

4.9 数组堆叠

 

在 numpy 中,还有一系列以 as 开头的方法,它们可以将特定输入转换为数组,亦可将数组转换为矩阵、标量,ndarray等。如下:

  • stack(arrays,axis):沿着新轴连接数组的序列。
  • column_stack():将 1 维数组作为列堆叠到 2 维数组中。
  • hstack():按水平方向堆叠数组。
  • vstack():按垂直方向堆叠数组。
  • dstack():按深度方向堆叠数组。

这里以 stack(arrays,axis) 方法举例:



 
  1. import numpy as np

  2.  
  3. a = np.array([1, 2, 3])

  4. b = np.array([4, 5, 6])

  5. print(np.stack((a, b),axis=0))

  6. '''

  7. [[1 2 3]

  8. [4 5 6]]

  9. '''

  10. print(np.column_stack((a,b)))

  11. '''

  12. [[1 4]

  13. [2 5]

  14. [3 6]]

  15. '''

  16. print(np.hstack((a,b))) # [1 2 3 4 5 6]

  17. print(np.vstack((a,b)))

  18. '''

  19. [[1 2 3]

  20. [4 5 6]]

  21. '''

  22. print(np.dstack((a,b)))

  23. '''

  24. [[[1 4]

  25. [2 5]

  26. [3 6]]]

  27. '''

 

tile 与 repeat



 
  1. a = array([[1, 2], [3, 4]])

  2. # repeat each element 3 times

  3. repeat(a, 3)

  4.  
  5. => array([1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4])

  6.  
  7. # tile the matrix 3 times

  8. tile(a, 3)

  9.  
  10. => array([[1, 2, 1, 2, 1, 2],

  11. [3, 4, 3, 4, 3, 4]])

 

4.10 拆分

split 及与之相似的一系列方法主要是用于数组的拆分,列举如下:

  • split(ary,indices_or_sections,axis):将数组拆分为多个子数组。
  • dsplit(ary,indices_or_sections):按深度方向将数组拆分成多个子数组。
  • hsplit(ary,indices_or_sections):按水平方向将数组拆分成多个子数组。
  • vsplit(ary,indices_or_sections):按垂直方向将数组拆分成多个子数组。

下面,我们看一看 split 到底有什么效果:



 
  1. import numpy as np

  2.  
  3. a = np.arange(6).reshape(2,3)

  4. '''

  5. [[0 1 2]

  6. [3 4 5]]

  7. '''

  8. print(np.split(a, 3,axis=1))

  9. '''

  10. [array([[0],

  11. [3]]), array([[1],

  12. [4]]), array([[2],

  13. [5]])]

  14. '''

  15. print(np.split(a, 2,axis=0))

  16. '''

  17. [array([[0, 1, 2]]), array([[3, 4, 5]])]

  18. '''

  19. print(np.hsplit(a,3))

  20. '''

  21. [array([[0],

  22. [3]]), array([[1],

  23. [4]]), array([[2],

  24. [5]])]

  25. '''

  26. print(np.vsplit(a,2))

  27. '''

  28. [array([[0, 1, 2]]), array([[3, 4, 5]])]

  29. '''

numpy 中还有针对数组元素添加或移除的一些方法。

4.11 删除

  • delete(arr,obj,axis):沿特定轴删除数组中的子数组。

下面,依次对 4 种方法进行示例,首先是 delete 删除:



 
  1. import numpy as np

  2.  
  3. a = np.arange(12).reshape(3,4)

  4. print(a)

  5. '''

  6. [[ 0 1 2 3]

  7. [ 4 5 6 7]

  8. [ 8 9 10 11]]

  9. '''

  10. print(np.delete(a, 2, 1)) # 将第 3 列(索引 2)删除

  11. '''

  12. [[ 0 1 3]

  13. [ 4 5 7]

  14. [ 8 9 11]]

  15. '''

  16. print(np.delete(a, 2, 0)) # 将第 3 行(索引 2)删除

  17. '''

  18. [[0 1 2 3]

  19. [4 5 6 7]]

  20. '''

4.12 数组插入

  • insert(arr,obj,values,axis):依据索引在特定轴之前插入值。

再看一看 insert插入, 用法和 delete 很相似,只是需要在第三个参数位置设置需要插入的数组对象:



 
  1. import numpy as np

  2.  
  3. a = np.arange(12).reshape(3,4)

  4. b = np.arange(4)

  5.  
  6. print(np.insert(a, 2, b, 0)) # axis=0 按行插入 obj=2 a的第3行,即将b插入到a的第3行位置

  7. '''

  8. [[ 0 1 2 3]

  9. [ 4 5 6 7]

  10. [ 0 1 2 3]

  11. [ 8 9 10 11]]

  12. '''

 

4.13 附加

  • append(arr,values,axis):将值附加到数组的末尾,并返回 1 维数组。

append 的用法也非常简单。只需要设置好需要附加的值和轴位置就好了。它其实相当于只能在末尾插入的 insert,所以少了一个指定索引的参数。



 
  1. import numpy as np

  2.  
  3. a = np.arange(6).reshape(2,3)

  4. b = np.arange(3).reshape(1,3)

  5.  
  6. print(np.append(a, b)) # [0 1 2 3 4 5 0 1 2]

  7.  
  8. print(np.append(a, b,axis=0))

  9. '''

  10. [[0 1 2]

  11. [3 4 5]

  12. [0 1 2]]

  13. '''

4.14 重设尺寸

  • resize(a,new_shape):对数组尺寸进行重新设定。

resize 就很好理解了,直接举例子吧:

 



 
  1. import numpy as np

  2.  
  3. a = np.arange(10)

  4. print(a.reshape((2,5)))

  5. '''

  6. [[0 1 2 3 4]

  7. [5 6 7 8 9]]

  8. '''

  9. print(a)

  10. '''

  11. [0 1 2 3 4 5 6 7 8 9]

  12. '''

  13. a.resize((2,5))

  14. print(a)

  15. '''

  16. [[0 1 2 3 4]

  17. [5 6 7 8 9]]

  18. '''

 

你可能会纳闷了,这个 resize 看起来和上面的 reshape 一样呢,都是改变数组原有的形状。

其实,它们直接是有区别的,区别在于对原数组的影响。reshape 在改变形状时,不会影响原数组,相当于对原数组做了一份拷贝。而 resize 则是对原数组执行操作。

4.15 翻转数组

在 numpy 中,我们还可以对数组进行翻转操作:

  • fliplr(m):左右翻转数组。
  • flipud(m):上下翻转数组。

举个例子:



 
  1. import numpy as np

  2.  
  3. a = np.arange(6).reshape(2,3)

  4. print(a)

  5. '''

  6. [[0 1 2]

  7. [3 4 5]]

  8. '''

  9. print(np.fliplr(a))

  10. '''

  11. [[2 1 0]

  12. [5 4 3]]

  13. '''

  14. print(np.flipud(a))

  15. '''

  16. [[3 4 5]

  17. [0 1 2]]

  18. '''

4.16 增加一个新维度: newaxis

newaxis 可以帮助我们为数组增加一个新维度,比如说,将一个向量转换成列矩阵和行矩阵:

 



 
  1. import numpy as np

  2.  
  3.  
  4. v = np.array([1,2,3])

  5. shape(v)

  6. '''

  7. => (3,)

  8. '''

  9. # make a column matrix of the vector v

  10. v[:, newaxis]

  11. '''

  12. => array([[1],

  13. [2],

  14. [3]])

  15. '''

  16. # column matrix

  17. v[:,newaxis].shape

  18. '''

  19. => (3, 1)

  20. '''

  21. # row matrix

  22. v[newaxis,:].shape

  23. '''

  24. => (1, 3)

  25. '''


 

 

Numpy 的随机抽样功能非常强大,主要由 numpy.random 模块完成。

首先,我们需要了解如何使用 numpy 也就是生成一些满足基本需求的随机数据。主要由以下一些方法完成:

5.1 numpy.random.rand

numpy.random.rand(d0, d1, ..., dn) 方法的作用为:指定一个数组,并使用[0, 1) 区间随机数据填充,这些数据均匀分布。

 



 
  1. import numpy as np

  2.  
  3. np.random.rand(2,5)

 

5.2 numpy.random.randn

 

numpy.random.randn(d0, d1, ..., dn) 与 numpy.random.rand(d0, d1, ..., dn) 的区别在于,返回的随机数据符合标准正太分布。



 
  1. import numpy as np

  2.  
  3. np.random.randn(1,10)

5.3 numpy.random.randint

randint(low, high, size, dtype) 方法将会生成 [low, high) 的随机整数。注意这是一个半开半闭区间。



 
  1. import numpy as np

  2.  
  3. print(np.random.randint(2,5,10)) # [4 4 3 3 3 2 2 4 4 2]

 

5.4 numpy.random.random_integers

random_integers(low, high, size) 方法将会生成 [low, high] 的 np.int 类型随机整数。注意这是一个闭区间。



 
  1. import numpy as np

  2.  
  3. print(np.random.random_integers(2,5,10)) # [3 2 5 2 3 2 3 3 2 5]

5.5 numpy.random.random_sample

random_sample(size) 方法将会在 [0, 1) 区间内生成指定 size 的随机浮点数。



 
  1. import numpy as np

  2.  
  3. np.random.random_sample([10])

与 numpy.random.random_sample 类似的方法还有:

  • numpy.random.random([size])
  • numpy.random.ranf([size])
  • numpy.random.sample([size])

它们 4 个的效果都差不多。

5.6 numpy.random.choice

choice(a, size, replace, p) 方法将会给定的 1 维数组里生成随机数。



 
  1. import numpy as np

  2.  
  3. np.random.choice(10,5) # 将会在 np.arange(10) 中生成 5 个随机数

 

5.7 概率密度分布

除了上面介绍的 6 中随机数生成方法,numpy 还提供了大量的满足特定概率密度分布的样本生成方法。它们的使用方法和上面非常相似,这里就不再一一介绍了。列举如下:

  1. numpy.random.beta(a,b,size):从 Beta 分布中生成随机数。
  2. numpy.random.binomial(n, p, size):从二项分布中生成随机数。
  3. numpy.random.chisquare(df,size):从卡方分布中生成随机数。
  4. numpy.random.dirichlet(alpha,size):从 Dirichlet 分布中生成随机数。
  5. numpy.random.exponential(scale,size):从指数分布中生成随机数。
  6. numpy.random.f(dfnum,dfden,size):从 F 分布中生成随机数。
  7. numpy.random.gamma(shape,scale,size):从 Gamma 分布中生成随机数。
  8. numpy.random.geometric(p,size):从几何分布中生成随机数。
  9. numpy.random.gumbel(loc,scale,size):从 Gumbel 分布中生成随机数。
  10. numpy.random.hypergeometric(ngood, nbad, nsample, size):从超几何分布中生成随机数。
  11. numpy.random.laplace(loc,scale,size):从拉普拉斯双指数分布中生成随机数。
  12. numpy.random.logistic(loc,scale,size):从逻辑分布中生成随机数。
  13. numpy.random.lognormal(mean,sigma,size):从对数正态分布中生成随机数。
  14. numpy.random.logseries(p,size):从对数系列分布中生成随机数。
  15. numpy.random.multinomial(n,pvals,size):从多项分布中生成随机数。
  16. numpy.random.multivariate_normal(mean, cov, size):从多变量正态分布绘制随机样本。
  17. numpy.random.negative_binomial(n, p, size):从负二项分布中生成随机数。
  18. numpy.random.noncentral_chisquare(df,nonc,size):从非中心卡方分布中生成随机数。
  19. numpy.random.noncentral_f(dfnum, dfden, nonc, size):从非中心 F 分布中抽取样本。
  20. numpy.random.normal(loc,scale,size):从正态分布绘制随机样本。
  21. numpy.random.pareto(a,size):从具有指定形状的 Pareto II 或 Lomax 分布中生成随机数。
  22. numpy.random.poisson(lam,size):从泊松分布中生成随机数。
  23. numpy.random.power(a,size):从具有正指数 a-1 的功率分布中在 0,1 中生成随机数。
  24. numpy.random.rayleigh(scale,size):从瑞利分布中生成随机数。
  25. numpy.random.standard_cauchy(size):从标准 Cauchy 分布中生成随机数。
  26. numpy.random.standard_exponential(size):从标准指数分布中生成随机数。
  27. numpy.random.standard_gamma(shape,size):从标准 Gamma 分布中生成随机数。
  28. numpy.random.standard_normal(size):从标准正态分布中生成随机数。
  29. numpy.random.standard_t(df,size):从具有 df 自由度的标准学生 t 分布中生成随机数。
  30. numpy.random.triangular(left,mode,right,size):从三角分布中生成随机数。
  31. numpy.random.uniform(low,high,size):从均匀分布中生成随机数。
  32. numpy.random.vonmises(mu,kappa,size):从 von Mises 分布中生成随机数。
  33. numpy.random.wald(mean,scale,size):从 Wald 或反高斯分布中生成随机数。
  34. numpy.random.weibull(a,size):从威布尔分布中生成随机数。
  35. numpy.random.zipf(a,size):从 Zipf 分布中生成随机数。

 

 

6.1 三角函数

 

  1. numpy.sin(x):三角正弦。
  2. numpy.cos(x):三角余弦。
  3. numpy.tan(x):三角正切。
  4. numpy.arcsin(x):三角反正弦。
  5. numpy.arccos(x):三角反余弦。
  6. numpy.arctan(x):三角反正切。
  7. numpy.hypot(x1,x2):直角三角形求斜边。
  8. numpy.degrees(x):弧度转换为度。
  9. numpy.radians(x):度转换为弧度。
  10. numpy.deg2rad(x):度转换为弧度。
  11. numpy.rad2deg(x):弧度转换为度。

比如,我们可以用上面提到的 numpy.rad2deg(x) 将弧度转换为度。



 
  1. import numpy as np

  2.  
  3. print(np.rad2deg(np.pi)) # 180.0

6.2 双曲函数

在数学中,双曲函数是一类与常见的三角函数类似的函数。双曲函数经常出现于某些重要的线性微分方程的解中,使用 numpy 计算它们的方法为:

  1. numpy.sinh(x):双曲正弦。
  2. numpy.cosh(x):双曲余弦。
  3. numpy.tanh(x):双曲正切。
  4. numpy.arcsinh(x):反双曲正弦。
  5. numpy.arccosh(x):反双曲余弦。
  6. numpy.arctanh(x):反双曲正切。

 

6.3 数值修约

数值修约, 又称数字修约, 是指在进行具体的数字运算前, 按照一定的规则确定一致的位数, 然后舍去某些数字后面多余的尾数的过程[via. 维基百科]。比如, 我们常听到的「4 舍 5 入」就属于数值修约中的一种。

  1. numpy.around(a):平均到给定的小数位数。
  2. numpy.round_(a):将数组舍入到给定的小数位数。
  3. numpy.rint(x):修约到最接近的整数。
  4. numpy.fix(x, y):向 0 舍入到最接近的整数。
  5. numpy.floor(x):返回输入的底部(标量 x 的底部是最大的整数 i)。
  6. numpy.ceil(x):返回输入的上限(标量 x 的底部是最小的整数 i).
  7. numpy.trunc(x):返回输入的截断值。

随机选择几个浮点数,看一看上面方法的区别。



 
  1. >>> import numpy as np

  2.  
  3. >>> a = np.array([1.21, 2.53, 3.86])

  4. >>> a

  5. array([ 1.21, 2.53, 3.86])

  6.  
  7. >>> np.around(a)

  8. array([ 1., 3., 4.])

  9.  
  10. >>> np.round_(a)

  11. array([ 1., 3., 4.])

  12.  
  13. >>> np.rint(a)

  14. array([ 1., 3., 4.])

  15.  
  16. >>> np.fix(a)

  17. array([ 1., 2., 3.])

  18.  
  19. >>> np.floor(a)

  20. array([ 1., 2., 3.])

  21.  
  22. >>> np.ceil(a)

  23. array([ 2., 3., 4.])

  24.  
  25. >>> np.trunc(a)

  26. array([ 1., 2., 3.])

6.4 求和、求积、差分

下面这些方法用于数组内元素或数组间进行求和、求积以及进行差分。

  1. numpy.prod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积。
  2. numpy.sum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和。
  3. numpy.nanprod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积, 将 NaN 视作 1。
  4. numpy.nansum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和, 将 NaN 视作 0。
  5. numpy.cumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积。
  6. numpy.cumsum(a, axis, dtype):返回沿给定轴的元素的累积总和。
  7. numpy.nancumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积, 将 NaN 视作 1。
  8. numpy.nancumsum(a, axis, dtype):返回沿给定轴的元素的累积总和, 将 NaN 视作 0。
  9. numpy.diff(a, n, axis):计算沿指定轴的第 n 个离散差分。
  10. numpy.ediff1d(ary, to_end, to_begin):数组的连续元素之间的差异。
  11. numpy.gradient(f):返回 N 维数组的梯度。
  12. numpy.cross(a, b, axisa, axisb, axisc, axis):返回两个(数组)向量的叉积。
  13. numpy.trapz(y, x, dx, axis):使用复合梯形规则沿给定轴积分。
  14.  numpy.trace(a, offset=0, axis1=0, axis2=1, dtype=None, out=None):  # 等价于 diag(a).sum()

下面,我们选取几个举例测试一下:



 
  1. >>> import numpy as np

  2. >>> a=np.arange(5)

  3. >>> a

  4. array([0, 1, 2, 3, 4])

  5.  
  6. >>> np.prod(a) # 所有元素乘积

  7. 0

  8.  
  9. >>> np.sum(a) # 所有元素和

  10. 10

  11.  
  12. >>> np.nanprod(a) # 默认轴上所有元素乘积

  13. 0

  14.  
  15. >>> np.nansum(a) # 默认轴上所有元素和

  16. 10

  17.  
  18. >>> np.cumprod(a) # 默认轴上元素的累积乘积。

  19. array([0, 0, 0, 0, 0])

  20.  
  21. >>> np.diff(a) # 默认轴上元素差分。

  22. array([1, 1, 1, 1])

6.5 指数和对数

如果你需要进行指数或者对数求解,可以用到以下这些方法。

  1. numpy.exp(x):计算输入数组中所有元素的指数。
  2. numpy.expm1(x):对数组中的所有元素计算 exp(x) - 1.
  3. numpy.exp2(x):对于输入数组中的所有 p, 计算 2 ** p。
  4. numpy.log(x):计算自然对数。
  5. numpy.log10(x):计算常用对数。
  6. numpy.log2(x):计算二进制对数。
  7. numpy.log1p(x)log(1 + x)
  8. numpy.logaddexp(x1, x2)log2(2**x1 + 2**x2)
  9. numpy.logaddexp2(x1, x2)log(exp(x1) + exp(x2))

6.6 算术运算

当然,numpy 也提供了一些用于算术运算的方法,使用起来会比 python 提供的运算符灵活一些,主要是可以直接针对数组。

  1. numpy.add(x1, x2):对应元素相加。
  2. numpy.reciprocal(x):求倒数 1/x。
  3. numpy.negative(x):求对应负数。
  4. numpy.multiply(x1, x2):求解乘法。
  5. numpy.divide(x1, x2):相除 x1/x2。
  6. numpy.power(x1, x2):类似于 x1^x2。
  7. numpy.subtract(x1, x2):减法。
  8. numpy.fmod(x1, x2):返回除法的元素余项。
  9. numpy.mod(x1, x2):返回余项。
  10. numpy.modf(x1):返回数组的小数和整数部分。
  11. numpy.remainder(x1, x2):返回除法余数。

 



 
  1. >>> import numpy as np

  2.  
  3. >>> a1 = np.random.randint(0, 10, 5)

  4. >>> a2 = np.random.randint(0, 10, 5)

  5.  
  6. >>> a1

  7. array([3, 7, 8, 0, 0])

  8.  
  9. >>> a2

  10. array([1, 8, 6, 4, 4])

  11.  
  12. >>> np.add(a1, a2)

  13. array([ 4, 15, 14, 4, 4])

  14.  
  15. >>> np.reciprocal(a1)

  16. array([0, 0, 0, , ])

  17.  
  18. >>> np.negative(a1)

  19. array([-3, -7, -8, 0, 0])

  20.  
  21. >>> np.multiply(a1, a2)

  22. array([ 3, 56, 48, 0, 0])

  23.  
  24. >>> np.divide(a1, a2)

  25. array([3, 0, 1, 0, 0])

  26.  
  27. >>> np.power(a1, a2)

  28. array([3,5764801,262144,0,0])

  29.  
  30. >>> np.subtract(a1, a2)

  31. array([ 2, -1, 2, -4, -4])

  32.  
  33. >>> np.fmod(a1, a2)

  34. array([0, 7, 2, 0, 0])

  35.  
  36. >>> np.mod(a1, a2)

  37. array([0, 7, 2, 0, 0])

  38.  
  39. >>> np.modf(a1)

  40. (array([ 0., 0., 0., 0., 0.]), array([ 3., 7., 8., 0., 0.]))

  41.  
  42. >>> np.remainder(a1, a2)

  43. array([0, 7, 2, 0, 0])

  44. >>>

 

6.7 矩阵和向量积

求解向量、矩阵、张量的点积等同样是 numpy 非常强大的地方。

  1. numpy.dot(a,b):求解两个数组的点积。
  2. numpy.vdot(a,b):求解两个向量的点积。
  3. numpy.inner(a,b):求解两个数组的内积。
  4. numpy.outer(a,b):求解两个向量的外积。
  5. numpy.matmul(a,b):求解两个数组的矩阵乘积。
  6. numpy.tensordot(a,b):求解张量点积。
  7. numpy.kron(a,b):计算 Kronecker 乘积。

6.8 其他

除了上面这些归好类别的方法,numpy 中还有一些用于数学运算的方法,归纳如下:

  1. numpy.angle(z, deg):返回复参数的角度。
  2. numpy.real(val):返回数组元素的实部。
  3. numpy.imag(val):返回数组元素的虚部。
  4. numpy.conj(x):按元素方式返回共轭复数。
  5. numpy.convolve(a, v, mode):返回线性卷积。
  6. numpy.sqrt(x):平方根。
  7. numpy.cbrt(x):立方根。
  8. numpy.square(x):平方。
  9. numpy.absolute(x):绝对值, 可求解复数。
  10. numpy.fabs(x):绝对值。
  11. numpy.sign(x):符号函数。
  12. numpy.maximum(x1, x2):最大值。
  13. numpy.minimum(x1, x2):最小值。
  14. numpy.nan_to_num(x):用 0 替换 NaN。
  15. numpy.interp(x, xp, fp, left, right, period):线性插值。
  16. numpy.mean() 平均值
  17. numpy.std() 标准差 numpy.var() 方差
  18. numpy.max() 最大值numpy.min() 最小值

 

上面,我们分为 8 个类别,介绍了 numpy 中常用到的数学函数。这些方法让复杂的计算过程表达更为简单。除此之外,numpy 中还包含一些代数运算的方法,尤其是涉及到矩阵的计算方法,求解特征值、特征向量、逆矩阵等,非常方便。

  1. numpy.linalg.cholesky(a):Cholesky 分解。
  2. numpy.linalg.qr(a ,mode):计算矩阵的 QR 因式分解。
  3. numpy.linalg.svd(a ,full_matrices,compute_uv):奇异值分解。
  4. numpy.linalg.eig(a):计算正方形数组的特征值和右特征向量。
  5. numpy.linalg.eigh(a, UPLO):返回 Hermitian 或对称矩阵的特征值和特征向量。
  6. numpy.linalg.eigvals(a):计算矩阵的特征值。
  7. numpy.linalg.eigvalsh(a, UPLO):计算 Hermitian 或真实对称矩阵的特征值。
  8. numpy.linalg.norm(x ,ord,axis,keepdims):计算矩阵或向量范数。
  9. numpy.linalg.cond(x ,p):计算矩阵的条件数。
  10. numpy.linalg.det(a):计算数组的行列式。
  11. numpy.linalg.matrix_rank(M ,tol):使用奇异值分解方法返回秩。
  12. numpy.linalg.slogdet(a):计算数组的行列式的符号和自然对数。
  13. numpy.trace(a ,offset,axis1,axis2,dtype,out):沿数组的对角线返回总和。
  14. numpy.linalg.solve(a,b):求解线性矩阵方程或线性标量方程组。
  15. numpy.linalg.tensorsolve(a,b ,axes):为 x 解出张量方程a x = b
  16. numpy.linalg.lstsq(a,b ,rcond):将最小二乘解返回到线性矩阵方程。
  17. numpy.linalg.inv(a):计算逆矩阵。
  18. numpy.linalg.pinv(a ,rcond):计算矩阵的(Moore-Penrose)伪逆。
  19. numpy.linalg.tensorinv(a ,ind):计算N维数组的逆。

8.1 数组索引

我们可以通过索引值(从 0 开始)来访问 Ndarray 中的特定位置元素。Numpy 中的索引和 python 对 list 索引的方式非常相似,但又有所不同。我们一起来看一下:

首先是,一维数据索引:

 



 
  1. >>> import numpy as np

  2.  
  3. >>> a = np.arange(10)

  4. >>> a

  5. array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

  6.  
  7. # 获取索引值为 1 的数据

  8. >>> a[1]

  9. 1

  10. # 分别获取索引值为 1,2,3 的数据

  11. >>> a[[1, 2, 3]]

  12. array([1, 2, 3])

对于二维数据而言:



 
  1. >>> import numpy as np

  2.  
  3. >>> a = np.arange(20).reshape(4,5)

  4.  
  5. >>> a

  6. array([[ 0, 1, 2, 3, 4],

  7. [ 5, 6, 7, 8, 9],

  8. [10, 11, 12, 13, 14],

  9. [15, 16, 17, 18, 19]])

  10.  
  11. # 获取第 2 行,第 3 列的数据

  12. >>> a[1,2]

  13. 7


如果,我们使用 python 中的 list 索引同样的值,看看有什么区别:

 

 



 
  1. # 创建一个数据相同的 list

  2. >>> a = [[ 0, 1, 2, 3, 4],[ 5, 6, 7, 8, 9],[10, 11, 12, 13, 14],[15, 16, 17, 18, 19]]

  3.  
  4. # 按照上面的方法获取第 2 行,第 3 列的数据,报错。

  5. >>> a[1,2]

  6. Traceback (most recent call last):

  7. File "<stdin>", line 1, in <module>

  8. TypeError: list indices must be integers or slices, not tuple

  9.  
  10. # python 中 list 索引 2 维数据的方法

  11. >>> a[1][2]

  12. 7

如何索引二维 Ndarray 中的多个元素值,这里使用逗号,分割:



 
  1. >>> import numpy as np

  2.  
  3. >>> a = np.arange(20).reshape(4,5)

  4.  
  5. >>> a

  6. array([[ 0, 1, 2, 3, 4],

  7. [ 5, 6, 7, 8, 9],

  8. [10, 11, 12, 13, 14],

  9. [15, 16, 17, 18, 19]])

  10.  
  11. # 索引

  12. >>> a[[1,2],[3,4]]

  13. array([ 8, 14])

 

 

这里需要注意索引的对应关系。我们实际获取的是[1,3],也就是第2行和第4列对于的值8。以及[2, 4],也就是第3行和第5列对于的值14

那么,三维数据呢?



 
  1. >>> import numpy as np

  2.  
  3. >>> a = np.arange(30).reshape(2,5,3)

  4. >>> a

  5. array([[[ 0, 1, 2],

  6. [ 3, 4, 5],

  7. [ 6, 7, 8],

  8. [ 9, 10, 11],

  9. [12, 13, 14]],

  10.  
  11. [[15, 16, 17],

  12. [18, 19, 20],

  13. [21, 22, 23],

  14. [24, 25, 26],

  15. [27, 28, 29]]])

  16.  
  17. # 索引

  18. >>> a[[0,1],[1,2],[1,2]]

  19. array([ 4, 23])

这里,[0,1]分布代表 axis = 0 和 axis = 1。而,后面的[1,2],[1,2] 分别选择了第 2 行第2 列和第 3 行第3 列的两个数。
 

8.2 数组切片

Numpy 里面针对Ndarray的数组切片和 python 里的list 切片操作是一样的。其语法为:


Ndarray[start:stop:step]

start:stop:step 分布代表起始索引:截至索引:步长。对于一维数组:



 
  1. >>> import numpy as np

  2.  
  3. >>> a = np.arange(10)

  4. >>> a

  5. array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

  6.  
  7. >>> a[:5]

  8. array([0, 1, 2, 3, 4])

  9.  
  10. >>> a[5:10]

  11. array([5, 6, 7, 8, 9])

  12.  
  13. >>> a[0:10:2]

  14. array([0, 2, 4, 6, 8])


对于多维数组,我们只需要用逗号,分割不同维度即可:

 



 
  1. >>> import numpy as np

  2.  
  3. >>> a = np.arange(20).reshape(4,5)

  4.  
  5. >>> a

  6. array([[ 0, 1, 2, 3, 4],

  7. [ 5, 6, 7, 8, 9],

  8. [10, 11, 12, 13, 14],

  9. [15, 16, 17, 18, 19]])

  10.  
  11. # 先取第 3,4 列(第一个维度),再取第 1,2,3 行(第二个维度)。

  12. >>> a[0:3,2:4]

  13. array([[ 2, 3],

  14. [ 7, 8],

  15. [12, 13]])

  16.  
  17. # 按步长为 2 取所有列和所有行的数据。

  18. >>> a[:,::2]

  19. array([[ 0, 2, 4],

  20. [ 5, 7, 9],

  21. [10, 12, 14],

  22. [15, 17, 19]])

 

 

当超过 3 维或更多维时,用 2 维数据的切片方式类推即可。

8.3 索引与切片区别

你可能有点疑问,上面的索引和切片怎么看起来这么相似呢?

它们的语法的确很相似,但实际上有区别:

1. 修改切片中的内容会影响原始数组。



 
  1. >>> import numpy as np

  2.  
  3. >>> a = np.arange(10)

  4. >>> a

  5. array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

  6.  
  7. >>> a[1] = 100

  8.  
  9. >>> a

  10. array([0, 100, 2, 3, 4, 5, 6, 7, 8, 9])


除此之外,切片只能通过步长控制得到连续的值,而索引可以得到任意值。也就是说,索引的自由度更大。

 

8.4 高级索引(Fancy indexing)

指使用列表或者数组进行索引:

 



 
  1. from numpy import *

  2.  
  3. A = array([[n+m*10 for n in range(5)] for m in range(5)])

  4. print(A)

  5. '''

  6. [[ 0 1 2 3 4]

  7. [10 11 12 13 14]

  8. [20 21 22 23 24]

  9. [30 31 32 33 34]

  10. [40 41 42 43 44]]

  11. '''

  12. row_indices = [1, 2, 3]

  13. print(A[row_indices])

  14. '''

  15. => array([[10, 11, 12, 13, 14],

  16. [20, 21, 22, 23, 24],

  17. [30, 31, 32, 33, 34]])

  18. '''

  19. col_indices = [1, 2, -1] # remember, index -1 means the last element

  20. print(A[row_indices, col_indices])

  21. '''

  22. => array([11, 22, 34])

  23. '''

我们也可以使用索引掩码:

 

 



 
  1. from numpy import *

  2.  
  3. B = array([n for n in range(5)])

  4. print(B)

  5. '''

  6. => array([0, 1, 2, 3, 4])

  7. '''

  8. row_mask = array([True, False, True, False, False])

  9. print(B[row_mask])

  10. '''

  11. => array([0, 2])

  12. '''

  13.  
  14. # same thing

  15. row_mask = array([1,0,1,0,0], dtype=bool)

  16. print(B[row_mask])

  17.  
  18. '''

  19. => array([0, 2])

  20. '''


使用比较操作符生成掩码:

 

 



 
  1. from numpy import *

  2.  
  3. x = arange(0, 10, 0.5)

  4. print(x)

  5. '''

  6. => array([ 0. , 0.5, 1. , 1.5, 2. , 2.5, 3. , 3.5, 4. , 4.5, 5. ,

  7. 5.5, 6. , 6.5, 7. , 7.5, 8. , 8.5, 9. , 9.5])

  8. '''

  9. mask = (5 < x) * (x < 7.5)

  10. print(mask)

  11. '''

  12. => array([False, False, False, False, False, False, False, False, False,

  13. False, False, True, True, True, True, False, False, False,

  14. False, False], dtype=bool)

  15. '''

  16. print(x[mask])

  17. '''

  18. => array([ 5.5, 6. , 6.5, 7. ])

  19. '''

  20. mask=(5 < x) - (x < 7.5)

  21. print(mask)

  22. '''

  23. [ True True True True True True True True True True True False

  24. False False False True True True True True]

  25. '''

  26. print(x[mask])

  27. '''

  28. [ 0. 0.5 1. 1.5 2. 2.5 3. 3.5 4. 4.5 5. 7.5 8. 8.5 9.

  29. 9.5]

  30. '''



 

 

最后,再介绍几个 numpy 针对数组元素的使用方法,分别是排序、搜索和计数。

9.1 排序

我们可以使用 numpy.sort方法对多维数组元素进行排序。其方法为:


numpy.sort(a, axis=-1, kind='quicksort', order=None)

其中:

  • a:数组。
  • axis:要排序的轴。如果为None,则在排序之前将数组铺平。默认值为 -1,沿最后一个轴排序。
  • kind{'quicksort','mergesort','heapsort'},排序算法。默认值为 quicksort

举个例子:

 



 
  1. >>> import numpy as np

  2.  
  3. >>> a = np.random.rand(20).reshape(4,5)

  4. >>> a

  5. array([[ 0.32930243, 0.63665893, 0.67589989, 0.05413352, 0.26090526],

  6. [ 0.6996066 , 0.66006238, 0.88240934, 0.17563549, 0.03015105],

  7. [ 0.79075184, 0.40115859, 0.39336513, 0.64691791, 0.96333534],

  8. [ 0.20052738, 0.46157057, 0.48653336, 0.34537645, 0.54597273]])

  9.  
  10. >>> np.sort(a)

  11. array([[ 0.05413352, 0.26090526, 0.32930243, 0.63665893, 0.67589989],

  12. [ 0.03015105, 0.17563549, 0.66006238, 0.6996066 , 0.88240934],

  13. [ 0.39336513, 0.40115859, 0.64691791, 0.79075184, 0.96333534],

  14. [ 0.20052738, 0.34537645, 0.46157057, 0.48653336, 0.54597273]])

 

除了 numpy.sort,还有这样一些对数组进行排序的方法:

  1. numpy.lexsort(keys ,axis):使用多个键进行间接排序。
  2. numpy.argsort(a ,axis,kind,order):沿给定轴执行间接排序。
  3. numpy.msort(a):沿第 1 个轴排序。
  4. numpy.sort_complex(a):针对复数排序。

9.2 搜索和计数

除了排序,我们可以通过下面这些方法对数组中元素进行搜索和计数。列举如下:

  1. argmax(a ,axis,out):返回数组中指定轴的最大值的索引。
  2. nanargmax(a ,axis):返回数组中指定轴的最大值的索引,忽略 NaN。
  3. argmin(a ,axis,out):返回数组中指定轴的最小值的索引。
  4. nanargmin(a ,axis):返回数组中指定轴的最小值的索引,忽略 NaN。
  5. argwhere(a):返回数组中非 0 元素的索引,按元素分组。
  6. nonzero(a):返回数组中非 0 元素的索引。
  7. flatnonzero(a):返回数组中非 0 元素的索引,并铺平。
  8. where(条件,x,y):根据指定条件,从指定行、列返回元素。
  9. searchsorted(a,v ,side,sorter):查找要插入元素以维持顺序的索引。
  10. extract(condition,arr):返回满足某些条件的数组的元素。
  11. count_nonzero(a):计算数组中非 0 元素的数量。

选取其中的一些方法举例:



 
  1. >>> import numpy as np

  2. >>> a = np.random.randint(0,10,20)

  3.  
  4. >>> a

  5. array([3, 2, 0, 4, 3, 1, 5, 8, 4, 6, 4, 5, 4, 2, 6, 6, 4, 9, 8, 9])

  6.  
  7. >>> np.argmax(a)

  8. 17

  9.  
  10. >>> np.nanargmax(a)

  11. 17

  12.  
  13. >>> np.argmin(a)

  14. 2

  15.  
  16. >>> np.nanargmin(a)

  17. 2

  18.  
  19. >>> np.argwhere(a)

  20. array([[ 0],[ 1],[ 3],[ 4],[ 5],[ 6],[ 7],[ 8],[ 9],[10],[11],[12],[13],[14],[15],[16],[17],[18],[19]], dtype=int64)

  21.  
  22. >>> np.nonzero(a)

  23. (array([ 0, 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19], dtype=int64),)

  24.  
  25. >>> np.flatnonzero(a)

  26. array([ 0, 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19], dtype=int64)

  27.  
  28. >>> np.count_nonzero(a)

  29. 19


 

where

使用 where 函数能将索引掩码转换成索引位置:

 



 
  1. from numpy import *

  2.  
  3. x = arange(0, 10, 0.5)

  4. '''

  5. array([ 0. , 0.5, 1. , 1.5, 2. , 2.5, 3. , 3.5, 4. , 4.5, 5. ,

  6. 5.5, 6. , 6.5, 7. , 7.5, 8. , 8.5, 9. , 9.5])

  7. '''

  8. mask = (5 < x) * (x < 7.5)

  9. '''

  10. => array([False, False, False, False, False, False, False, False, False,

  11. False, False, True, True, True, True, False, False, False,

  12. False, False], dtype=bool)

  13. '''

  14.  
  15. x[mask]

  16. '''

  17. => array([ 5.5, 6. , 6.5, 7. ])

  18. '''

  19.  
  20. indices = where(mask)

  21. '''

  22. => (array([11, 12, 13, 14]),)

  23. '''

  24.  
  25. x[indices] # this indexing is equivalent to the fancy indexing x[mask]

  26. '''

  27. => array([ 5.5, 6. , 6.5, 7. ])

  28. '''

 

diag

 

使用 diag 函数能够提取出数组的对角线:



 
  1. from numpy import *

  2.  
  3.  
  4. A = array([[n+m*10 for n in range(5)] for m in range(5)])

  5. '''

  6. => array([[ 0, 1, 2, 3, 4],

  7. [10, 11, 12, 13, 14],

  8. [20, 21, 22, 23, 24],

  9. [30, 31, 32, 33, 34],

  10. [40, 41, 42, 43, 44]])

  11. '''

  12. diag(A)

  13. '''

  14. => array([ 0, 11, 22, 33, 44])

  15. '''

  16. diag(A, -1)

  17. '''

  18. array([10, 21, 32, 43])

  19. '''

 

take

take 函数与高级索引(fancy indexing)用法相似:



 
  1. from numpy import *

  2.  
  3.  
  4. v2 = arange(-3,3)

  5. '''

  6. => array([-3, -2, -1, 0, 1, 2])

  7. '''

  8. row_indices = [1, 3, 5]

  9. v2[row_indices] # fancy indexing

  10. '''

  11. => array([-2, 0, 2])

  12. '''

  13. v2.take(row_indices)

  14. '''

  15. => array([-2, 0, 2])

  16. '''

但是 take 也可以用在 list 和其它对象上:



 
  1. take([-3, -2, -1, 0, 1, 2], row_indices)

  2.  
  3. => array([-2, 0, 2])

 

choose

选取多个数组的部分组成新的数组:



 
  1. from numpy import *

  2.  
  3.  
  4. which = [1, 0, 1, 0]

  5. choices = [[-1,-2,-3,-4], [5,6,7,8]]

  6. print(choose(which, choices))

  7. '''

  8. => array([ 5, -2, 7, -4])

  9. '''

python3-numpy

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python3-numpy

参考地址:1、https://www.shiyanlou.com/courses/9122、https://www.shiyanlou.com/courses/3483、https://docs.scipy.org/doc/numpy/re
2023-01-31

Python3 安装 numpy 科学库

[root@Singapore numpy]# wget https://pypi.python.org/packages/ee/66/7c2690141c520db08b6a6f852fa768f421b0b50683b7bbcd88ef
2023-01-31

Python3教程——5、Python3

一、Pycharm常用快捷键有颜色的为很常用,或不易发现 编辑类:Ctrl + Space 基本的代码完成(类、方法、属性)Ctrl + Alt + Space 类名完成Ctrl + Shift + Enter 语句完成Ctrl + P 参
2023-01-31

python3 numpy中数组相乘np.dot(a,b)运算的规则是什么

这篇文章主要介绍python3 numpy中数组相乘np.dot(a,b)运算的规则是什么,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!python np.dot(a,b)运算规则解析首先我们知道dot运算时不满足交
2023-06-14

python3 cookbook

使用deque(maxlen=N)构造函数会新建一个固定大小的队列.当新的元素加入并且这个队列已满的时候,最老的元素会被移除掉.在队列两端插入或者删除元素时间复杂度都是O(1), 而在列表的开头插入或删除元素的时间复杂度为O(N).当要查找
2023-01-31

Python3 spider

http://blog.jobbole.com/77821/Python3网络爬虫的一个资料,还可以,备份。
2023-01-31

Python3 isinstance()

描述isinstance() 函数来判断一个对象是否是一个已知的类型,类似 type()。isinstance() 与 type() 区别:type() 不会认为子类是一种父类类型,不考虑继承关系。isinstance() 会认为子类是一种
2023-01-31

python3-socketserver

目录socketserver模块基于TCP链接的简单并发程序基于UDP无链接的简单并发程序错误笔记:ConnectionAbortedError: [WinError 10053] 你的主机中的软件中止了一个已建立的连接。Connectio
2023-01-31

python3_01.python3.

CentOS 6.5 安装Python 3.5本篇文章来源于 Linux公社网站(www.linuxidc.com)  原文链接:http://www.linuxidc.com/Linux/2015-11/124908.htm1、CentO
2023-01-31

Python3 CookBook |

文章首发于知乎专栏,欢迎关注。https://zhuanlan.zhihu.com/py...以下测试代码全部基于 Python31、查找最大或最小的 N 个元素工作中有时会遇到这样的需求,取出数据中前面 10% 的值,或者最后 10% 的
2023-01-31

python3 GUI

用python3创建窗口并显示修改窗口的名字在窗口中加入标签在窗口中加入按钮使按钮有实际意义添加可编辑文本框用Tkinter实现一个简单的GUI程序,单击click按钮时会在终端打印出’hello world’,方法一用Tkinter实现一
2023-01-31

python3 day7

三层目录:功能要求:1. 输入即可进入下一层2. 按q退出3. 按b可以回退到上一层代码:#!/usr/bin/env python# -*- coding:utf-8 -*-menu={    '山东':{        '青岛': ['
2023-01-31

python3 functions

print('strings',end='')input()len()str() int() float()True Falseand not orif elif else while break continuefor i in rang
2023-01-31

python3 __name__

我们经常会在各种代码中见到一个__name__ == '__main__', 这究竟是什么意思呢当一个python文件是被当做一个脚本运行的时候, 它的__name__就为__main__, 比如以下代码>>> def add(x, y):
2023-01-31

python3 asyncio

asyncio 是用来编写并发代码的库,使用async/await语法。asyncio 被用作多个提供高性能 Python 异步框架的基础,包括网络和网站服务,数据库连接库,分布式任务队列等等。asyncio 往往是构建 IO 密集型和高层
2023-01-31

python3+requests:pos

前言:post请求我在python接口自动化2-发送post请求详解(二)已经讲过一部分了,主要是发送一些较长的数据,还有就是数据比较安全等,可以参考Get,Post请求方式经典详解进行学习一下。我们要知道post请求四种传送正文方式首先需
2023-01-31

python3- global

'''global函数的使用'''# 全局定义一个参数aglobal aa=4# 给a赋值a=3def inita(): # 全局定义一个参数a global a a=3inita()#打印结果为3 因为inita方法内
2023-01-31

Python3 类

目录Python3 类继承项目组织方式类编码风格在Python中,首字母大写的名称值得是类,而小写的名称指的是根据类创建的实例。Python类中的每个属性都必须有初始值。可以在__init__()方法内为某个属性设置默认初始值,此时无需包含
2023-01-31

Python3 django2.0

以下设置,适用于python3.5及以前的pip install pycryptoimport base64from Crypto.Cipher import AESfrom Crypto import RandomBS = 16ke
2023-01-31

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录