查看原文
其他

一图胜千言,超形象图解NumPy教程!

pythonic生物人 pythonic生物人 2022-12-04
  • NumPy是Python中诸多数据科学库的重要基础,例如,pandas,OpenCV,TensorFlow等,学习NumPy对其它NumPy依赖数据科学库意义重大👇。
  • 本文翻译一篇不错的NumPy基础图解教程,从一维数组(向量)二维数组(矩阵)多维数组(3维及更高维数组)介绍NumPy。
  • 原文:NumPy Illustrated: The Visual Guide to NumPy,文章灵感部分来自👉Jay Alammar的NumPy图解文章

0、NumPy数组 vs Python列表

  • Numpy数组中插入、移除元素没Python列表高效;
  • Numpy数组可直接做四则运算、Python列表则需借助列表推倒式等;
  • Numpy数组更紧凑,高维时尤为明显;
  • Numpy数组向量化后运算速度比Python列表更快;
  • Numpy数组通常是同质化的,仅仅当数组中元素类型一致时处理速度快。

1、一维数组 (向量)

1.1 数组创建

  • 通过Python列表创建⚠️必须确保列表中元素类型一致,否则,进一步处理报错。⚠️NumPy数组区别于Python列表,不能在数组末尾直接扩展元素。
  • 通过np.zeros或np.empty等创建 可以通过np.zeros、np.ones、np.empty、np.full等创建数组。
  • 通过np.zeros_like或np.empty_like等创建 以上都有对应的_like函数,可快速创建a数组长度一致数组, 
  • 通过np.arange和np.linspace创建 np.arange类似于Python range⚠️np.arange对元素数据类型敏感,特别是float类别,以下方式可供参考
  • 创建随机数组 已弃用方法,新方法, 

1.2 数组索引

1.1中介绍了多种构建数组的方法,1.2中介绍如何愉快的从数组中取元素。

  • 常见索引方法
  • 布尔运算符索引 ⚠️不能用三元运算符,如3<=a<=5。
  • np.where、np.clip+布尔运算符索引

1.3 数组操作

计算速度是NumPy的亮点之一,其数组运算操作速度接近C++,把数组当作整体来运算,避免Python的循环,可以解决一部分Python慢的问题,这一节介绍NumPy的数组操作。

  • 加减乘除、取整等基础操作 类似python加减乘除、取余数,向上、向下、四舍五入最大、最小、均值等,
  • 三角函数
  • 标量计算
  • 支持更多数学方法
  • 排序 只有部分Python列表排序操作,

1.4 数组元素查找

无Python list的index函数,通常有三种方法,

  • where,但不够pythonic、需压遍历数组;
  • next,较快,需要Numba;
  • searchsorted,适合已排序数组。

1.5 浮点数比较


2 二维数组 (矩阵)

2.1 二维数组创建

同一维数组,⚠️使用[[]],随机数组构建


2.2 二维数组索引

比Python嵌套列表更方便


2.3 二维数组操作

NumPy支持跨行、跨列操作,此时NumPy引入了axis的概念,axis=1,axis=0👇,

  • 行列or行or列求和 
  • +、-、*、/、//、**和@  +、-、*、/、//、**类似一维数组,@为二维数组独有,二维数组整体计算,二维数组与单个元素、一维数组计算,@计算非对称线性代数外积,
  • 行/列向量计算
  • 二维数组变形 一维数组、二维数组之间互转,
  • hstack、vstack、column_stack拼接数组
  • hsplit、vsplit拆分二维数组
  • tile、repeat复制数组
  • delete二维数组删除 
  • insert二维数组插入 
  • append二维数组末尾操作
  • pad二维数组边界操作

2.4 二维数组网格化

针对网格化,C、传统Python及MATLAB都有解决办法,NumPy的广播机制让网格化更高效,此外,网格还可以用于数组索引,


2.5 二维数组统计

支持min/max, argmin/argmax, mean/median/percentile, std/var等函数,前面2.3节介绍过部分。argmin/argmax返回最大、最小值下标,all和any适用特定维度, 


2.6 二维数组排序

注意指定axis,

  • argsort按某一列排序
  • lexsort对所有列进行排序 ⚠️总是按行执行,从下到上,
  • sort结合order

多维数组 (3维及更高维数组)

下面主要以3维数组为例。

3.1 多维数组创建

通过reshape 1维数组、嵌套Python list创建多维数组,索引(z,y,x)中,z是平面方向,(y,x)在z平面上坐标,


3.2 多维数组创建hstack,vstack

适用3维数组,多了一个dstack,

⚠️但是,这些函数支持的索引顺序是(y,x,z),需要借助concatenate改变多维数组布局,广播机制也适用多维数组,einsum(Einstein summation)函数在多维数组中可避免过多Python循环,让代码更简洁,

-END-

点击直达历史文章

👉250+篇原创导航👈

关注Pythonic生物人

加微信

备注来意(交流群、合作等等)

日拱一卒无有尽,功不唐捐终入海!「❤️动手点个赞,下期见~」 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存