Python 数据可视化包

17 Mar 2025 | 5 分钟阅读

当处理大量数据集时,完全理解客户在表格形式中看到的内容可能会很困难。为了使我们的数据更有条理,理解其含义,并选择合适的模型,我们必须对其进行可视化或以图形方式表示。因此,我们可以看到图表或 CSV 文件中看不见的动态、趋势和相关性。

数据可视化

专注于可视化数据的这个数据分析领域称为数据可视化。它是一种有效的沟通数据洞察的方法,并以图形方式呈现数据。

当数据以图像、地图和图表的形式呈现时,人脑可以快速轻松地处理它。通过应用数据可视化,我们总是可以获得数据的视觉表示。大型和小型数据集都受益于数据可视化。然而,当处理大量数据集,以至于无法查看、解释和理解我们所有的记录时,它就非常有用。

Python 数据可视化

在当今的环境中,Python 的数据可视化可能是数据科学中经常使用的功能之一。Python 包提供了多种功能,允许用户设计优雅、交互式且高度可定制的图形。

Python 提供了多种绘图库,包括 Matplotlib、Seaborn 以及其他数据可视化工具。它们各自拥有独特的工具组合,用于创建定制化、引人入胜且具有教育意义、能够有效传达信息的故事。

Python 提供了多种数据可视化库,每种库都有其独特的功能。本教程将介绍其中四个库。每个库可能支持各种图表类型,并拥有一套独特的功能。

  • Matplotlib
  • Seaborn
  • Bokeh
  • Plotly

我们将逐一介绍这些库。

有用的 Python 可视化包

Matplotlib

Matplotlib 是一个用于 2D 数组绘图的 Python 可视化库。Python 库 Matplotlib 使用 NumPy 库。它与 Jupyter notebook、Web 应用程序服务器软件以及 Python 和 IPython shell 兼容。Matplotlib 提供了各种图表,包括散点图、折线图、条形图、直方图等,以帮助我们深入了解趋势、行为模式和关系。它最初由 John Hunter 于 2002 年推出。

散点图

散点图使用点来表示变量之间的相关性,可用于可视化关系。matplotlib 库的 scatter() 方法用于生成散点图。

输入

输出

Packages of Data Visualization in Python

柱状图

条形图或柱状图是一种图表,它使用长度和高度与其所代表的数据值成比例的矩形条来表示一类数据。

代码

输出

Packages of Data Visualization in Python

Seaborn

Seaborn 是一个 Python 模块,允许用户从数据集中构建统计可视化。它基于 matplotlib,并生成多种类型的可视化。它基于 pandas 的数据结构。该库在内部执行必要的建模和聚合,以提供富有洞察力的图形。

线图 (Line Plot)

在 Seaborn 中,使用 line plot() 方法创建了折线图。在这种情况下,我们也可以只传递 data 参数。

输入

输出

Packages of Data Visualization in Python

Bokeh

Bokeh 是一个面向 Web 浏览器的先进交互式可视化库。对于海量或流式数据资产,它可以提供引人入胜的图表和动态仪表板。该库中有许多清晰的图表可用于开发解决方案。它与 PyData 工具密切相关。该库非常适合基于特定用例开发独特的图像。交互式视觉效果可以支持“假设”场景模型。

折线图

也可以使用绘图和规划模块的 line() 方法来创建折线图。

输入

输出

Packages of Data Visualization in Python

添加小部件

  • Bokeh 提供了按钮、滑块、复选框和其他与 HTML 类似 GUI 组件。其中包括图表的交互式用户界面,使我们能够修改绘图参数、更改绘图数据等。让我们检查一些最流行的小部件以及如何使用和添加它们。
  • 按钮:此小部件将一个标准按钮项添加到绘图中。必须将一个唯一的 JavaScript 函数提供给模型的 CustomJS() 方法。
  • 复选框组:绘图现在包含一个标准复选框。与按钮一样,必须将自定义 JavaScript 方法传递给模型的 CustomJS() 方法。
  • 单选按钮组:此元素提供一个简单的单选按钮,并允许自定义 JavaScript 函数。

plotly

plotly.py 是一个高级、声明式、交互式、基于浏览器的 Python 可视化库。可用的可视化包括金融图表、统计图、3D 图和科学图形。Plotly 图表可以创建为独立的 HTML 文档、实时网页或 Jupyter notebook。Plotly 库提供了交互和编辑的可能性。丰富的 API 在本地和 Web 浏览器中都运行得非常好。

散点图

plotly.express 的 scatter() 函数可用于在 Plotly 中创建散点图。与 Seaborn 一样,此处也需要额外的 data 参数。

输入

输出

Packages of Data Visualization in Python
下一主题Python pympler 库