Pandas NumPy

2024 年 8 月 29 日 | 阅读 3 分钟

Numerical Python (Numpy) 定义为用于执行各种数值计算和处理多维和单维数组元素的 Python 包。 使用 Numpy 数组的计算速度比普通的 Python 数组快。

这个包是由 Travis Oliphant 在 2005 年创建的,它将祖先模块 Numeric 的功能添加到另一个模块 Numarray 中。 它还能够处理大量数据,并方便进行矩阵乘法和数据重塑。

NumPy 主要用 C 语言编写,它是 Python 的一个扩展模块。

Pandas 建立在 numpy 数组之上; 因此,numpy 帮助我们更有效地使用 pandas。

创建数组

数组的主要任务是将多个值存储在单个变量中。 它定义了可以在 numpy 中轻松处理的多维数组,如下例所示

示例

输出

New created array: 2 4 6 8 10

布尔索引

布尔索引定义为 numpy 的一个重要工具,它经常用于 pandas。 它的主要任务是使用 DataFrame 中数据的实际值。 我们可以通过以下不同方式在布尔索引中过滤数据

  • 使用布尔索引访问 DataFrame。
  • 将布尔掩码应用于 DataFrame。
  • 基于列值屏蔽数据。
  • 基于索引值屏蔽数据。

示例 1

此示例显示如何使用布尔索引访问 DataFrame

输出

name    age
True     Smith    28
True   William   39
False    Phill   34
True    Parker    36

示例 2

此示例显示如何使用 .loc[] 通过布尔索引访问 DataFrame

输出

name    age
True     Smith    28
True   William    39
True    Parker    36

重塑数组

重塑数组用于重塑数组,而无需更改其数据。

语法

参数

  • a: 定义要重塑的数组。
  • newshape: 定义应与原始形状兼容的新形状。 对于整数值,结果将是该长度的一维数组。 形状维度之一可以是 -1。
  • order: 这是一个可选参数,它使用索引顺序读取元素,并在索引的帮助下将元素放入重塑的数组中。

返回值

它返回重塑的数组。

示例

输出

The Original array is: 
 [ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15]
reshaped array: 
 [[ 0  1  2  3  4  5  6  7]
[ 8  9 10 11 12 13 14 15]]

reshaped array: 
 [[ 0  1]
[ 2  3]
[ 4  5]
[ 6  7]
[ 8  9]
 [10 11]
 [12 13]
 [14 15]]

下一个主题布尔索引