Python 中的 Pair Plot

17 Mar 2025 | 6 分钟阅读

Seaborn Pairplot 简介

在本教程中,我们将通过 Python 编程语言 中的 pairplot() 函数来理解 Seaborn Pairplot。此函数可以极大地帮助分析机器学习项目的探索性数据。我们还将了解 Seaborn 库的 pairplot() 函数的语法,并执行一些示例。

但在我们开始之前,让我们简要了解一下 Seaborn 库。

什么是 Python 中的 Seaborn 库?

Python 社区提供了一个开源库,用于数据可视化,称为 Seaborn。Seaborn 库是建立在 matplotlib 库之上开发的,并与 Python 中的 Pandas 数据结构紧密集成。可视化是 Seaborn 库的核心概念,帮助用户探索和理解数据。

由于 Seaborn 库组合和集成了不同的库,因此学习者熟悉 NumPyMatplotlibPandas 库是相当有必要的。

Seaborn 库提供了各种功能。其中一些列在下面

  1. Seaborn 提供了一个面向数据集的应用程序编程接口 (API),用于确定变量之间的关系。
  2. Seaborn 还提供了线性回归图的自动估计和绘图功能。
  3. Seaborn 还为多个绘图网格提供了对高层抽象的支持。
  4. Seaborn 还提供了对单变量和双变量分布的可视化。

现在,让我们了解如何下载和安装 Seaborn 库。

如何安装 Seaborn 库?

在下一节中,我们将讨论 Seaborn 库安装过程中涉及的步骤。

使用 pip 安装程序

我们可以使用 pip 安装程序安装最新版本的 Seaborn 库。我们所要做的就是在命令提示符或终端中键入以下命令。

使用 conda 安装程序

Anaconda 是一个多平台免费 Python 发行版,适用于 Windows、Linux 和 Mac 可用的 SciPy 堆栈。

我们可以使用 conda 安装程序安装最新版本的 Seaborn 库,方法是执行下面的命令

除了这两个之外,我们还可以安装 Seaborn 库的开发版本。

使用 GitHub 安装开发版本

要安装开发版本,我们可以访问下面的链接

https://github.com/mwaskom/seaborn

一些依赖项

在下载和安装 Seaborn 库时,需要注意一些依赖项。这些依赖项如下

  1. Python 版本 2.7 或 3.4+
  2. NumPy 库
  3. Matplotlib 库
  4. SciPy 库
  5. Pandas 库

初始化 Seaborn 库

完成下载和安装 Seaborn 库后,让我们创建一个空的 Python 文件,并使用以下语法来初始化该库

保存程序并执行文件。如果程序未返回导入错误,则表示库已成功安装。否则,请按上述方法重新安装该库。

Seaborn 库允许用户绘制各种图表,例如

  1. 饼图
  2. 条形图
  3. 分布图
  4. 散点图
  5. 热力图
  6. 对偶图

在本教程中,我们将仅讨论 Seaborn Pair Plots 和 pairplot() 函数。那么,让我们开始吧。

理解 Seaborn Pairplot 函数

Seaborn Pairplot 函数允许用户创建一个轴网格,其中数据中存储的每个数值变量在列和行的结构中共享 X 轴和 Y 轴。我们可以创建散点图来显示成对关系,以及显示列对角线中数据分布的分布图。

pairplot() 函数还可用于展示变量子集,或者我们可以在行和列上绘制不同类型的变量。

让我们看一看 Seaborn Pairplot 函数的语法,如下所示

Seaborn Pairplot 函数的语法

Pairplot 函数的参数

  1. data: data 参数接受根据要绘制的可视化类型的数据。值可以是 DataFrame、ArrayList of Arrays
  2. hue_order, order: hue_order 或简单地称为 order 参数是绘图中使用的分类变量的顺序。此参数的值可以是字符串列表。
  3. scale: scale 参数用于缩放绘图。此参数接受多个值,例如 area、countwidth
  4. scale_hue: scale_hue 参数接受 布尔值 以确定对于 TRUE,是否在主要分组变量的每个级别内估算尺度,或者对于 FALSE,是否在绘图的所有小提琴之间估算尺度。
  5. gridsize: gridsize 参数接受 整数值 来计算绘图的核密度。
  6. inner: inner 参数允许用户定义小提琴图的内点。此参数接受 box、point、quartile、stickNone 等值。
  7. orient: orient 参数允许用户确定绘图的方向。方向可以是垂直(用 'v' 表示)或水平(用 'h' 表示)。
  8. linewidth: linewidth 参数接受 浮点整数 作为其值,以确定绘图中使用的灰色线的宽度。
  9. color: color 参数允许用户指定绘图中所有数据元素的颜色范围。此参数的值可以是 matplotlib 颜色
  10. palette: palette 参数用于通过各种色调定义绘图中每个级别的所用颜色。
  11. ax: ax 参数用于定义将在其上构建绘图的轴。此参数的值可以是 matplotlib Axes

让我们看一些例子来理解 pairplot() 函数的工作原理

示例 1

输出

Pair Plot in Python

说明

在上面的示例中,我们导入了所需的库,并使用 Seaborn 的 load_dataset() 函数加载了 penguins 数据集进行工作。然后,我们使用 pairplot() 函数可视化带有 hue 参数设置为 'gender' 值的绘图。最后,我们使用 Matplotlib 的 show() 函数向用户显示绘图。结果,pair plot 已成功生成。

示例 2

输出

Pair Plot in Python

说明

在上面的示例中,我们导入了所需的库,并使用 Seaborn 的 load_dataset() 函数加载了 tips 数据集进行工作。然后,我们使用 pairplot() 函数可视化带有 kind 参数设置为 'kde' 值的绘图。最后,我们使用 Matplotlib 的 show() 函数向用户显示绘图。结果,pair plot 已成功生成。