如何在 Python 中创建瀑布图?

2025年1月5日 | 阅读 4 分钟

Python 是一种高级、解释型编程语言,以其清晰和易用性而闻名。由 Guido van Rossum 创建,并于 1991 年首次发布,Python 通过高质量的大空白使用强调代码的清晰度。它支持多种编程范式,包括过程式、面向对象式和函数式编程。Python 庞大而广泛的库,以及其庞大的第三方应用程序生态系统,使其在网络开发、数据分析、人工智能和科学计算等各种应用程序中都非常通用。其动态类型和自动内存管理进一步简化了开发。Python 的设计理念,强调代码的可读性和易用性,允许开发人员为小型和大型项目编写清晰、逻辑性强的代码。

图表

在 Python 中创建图表涉及利用提供数据可视化工具的库。这些库允许开发人员以图形方式表示数据,从而更容易理解和解释复杂的数据集。以下是与 Python 中图表创建相关的几个关键概念和库。

关键概念

  • 数据表示
    • 图表以视觉方式呈现数据,使模式、趋势和异常值更容易理解。
    • 常见的图表类型包括折线图、条形图、直方图、散点图、饼图和箱线图。
  • 库: 几个 Python 库满足不同的可视化需求,从基本绘图到高级交互式图形。

创建瀑布图

瀑布图显示一个初始值如何受到一系列中间的正面或负面值的影响。它有助于分析金融数据、收入分析等中顺序添加值的累积效应。

创建瀑布图的步骤

步骤 1:安装所需库

确保您已安装 Matplotlib 和 Pandas。如果尚未安装,您可以使用 pip 进行安装。

步骤 2:准备数据

您的数据应包含表示瀑布中步骤的类别和值。

步骤 3:计算累积值

计算运行总计以有效绘制值。

步骤 4:绘制瀑布图

使用 Matplotlib 创建图表;通过不同的颜色区分增加和减少。

示例

输出

How to Create a Waterfall Chart in Python?

说明

步骤 1:准备数据

  • 从包含类别和相应值的数据集开始,这些值表示瀑布图中的步骤。这些数据通常以字典格式存储,键为:“Category”和“Value”。
  • 将此字典转换为 Pandas DataFrame,以便于操作和绘图。

步骤 2:计算累积值

  • 计算“Value”列的累积总和。此累积总和表示值的运行总计,有助于在遍历类别时可视化增量变化。

步骤 3:计算条形的开始和结束点

  • 要创建瀑布效果,请计算每个条形的开始和结束点。
  • 条形的开始点是前一个类别的累积值。这可以通过将累积值移动一个位置,并将第一个位置填充为 0 来完成。
  • 结束点只是先前计算的累积值。

步骤 4:确定条形颜色

  • 根据值是正面还是负面来分配条形的颜色。通常,增加(正值)的颜色为绿色,减少(负值)的颜色为红色。这种区分有助于在视觉上区分收益和损失。

步骤 5:绘制瀑布图

  • 使用 Matplotlib 为每个类别创建条形图;使用计算出的开始和结束点来确定每个条形的高度和位置。
  • 按顺序绘制每个条形,确保条形有效堆叠以反映累积变化。
  • 特别是,对于最后一个类别,绘制一个单独的条形以突出显示累积总计,通常使用不同的颜色(例如,蓝色)。
  • 添加 y 轴标签和图表标题。旋转 x 轴标签,以确保它们易于阅读,尤其是在类别很多的情况下。