直方图的优缺点

2025年3月17日 | 阅读 7 分钟

直方图定义

假设在制造业中,我们在确定生产是否达到特定目标以及在某些情况下是否具有足够价值方面面临着几项挑战。它可以成为一个有用的故障排除工具。要理解更频繁出现的数据,并检查任何给定分布中的数据密度。利用这一点,我们可以比较不同的设备、操作员、供应商等。

直方图由卡尔·皮尔逊发明,显示了连续数据的概率分布。

Advantages and Disadvantages of Histogram

频率分布显示数据集中每个唯一值出现的频率。直方图是表示频率分布最流行的图形类型。虽然它与条形图有许多相似之处,但存在显著差异。它是七种基本质量工具之一,是用于汇总和分析数据的有用工具。

直方图是一种可视化表示,使用条形图来显示数据值,以显示一系列等大小数值区间中数据项的频率。X 轴和 Y 轴分别显示区间大小和频率。每个条形的高度表示每个区间的大小频率。它以一种更容易识别过程的离散度和中心趋势的方式呈现数据。直方图使我们能够观察数据的分布和形状。当样本量大于 50 时,它最有效。

例如,在钢铁制造业中,质量检验员会询问在给定厚度范围内生产的钢板数量。它还可以用于确定该过程是否生产符合要求范围的钢板。此外,根据范围的不同,其结果可能更少或更多。

Advantages and Disadvantages of Histogram

同样,制药公司的质量检验员试图确定瓶盖是否拧紧。检查瓶子至关重要,因为如果它们拧得太松或太紧,它们可能会泄漏或难以打开。在这里,他可以选择一些瓶子样本,并指定打开瓶盖所需的扭矩值;假设是 20。要查看可视化表示,请在直方图中绘制数据。

条形图和直方图非常相似。此图结合了折线图和垂直条形图。在这种情况下,使用大小相等的矩形来显示数据。直方图用于显示数据或信息在连续时间段内的分布。变量的频率与矩形条的面积有关。

虽然直方图和条形图可能看起来相似,但直方图旨在表示连续数据,而条形图显示变量出现频率。箱(bins)用于对这些连续数据进行分类。使用这些容器,可以快速识别大多数和少数点。此外,在绘制直方图时,应注意不要使箱太窄,这可能会影响频率分布的流动,或太宽,这会使数据变化难以看到。

Advantages and Disadvantages of Histogram

直方图是按图形方式排列的连续类别的频率分布。它是一个面积图,可以定义为一组矩形,其底边代表类别边界之间的分隔,面积与相关类别中的频率成正比。由于底边覆盖了类别边界之间的空间,因此此类表示中的所有矩形都是相邻的。对于相似的类别,矩形高度与相应频率成反比;对于不同的类别,矩形高度与频率密度成反比。

直方图类型

根据数据在频率上的分布方式,直方图可以分为多种类别。有许多不同的分布,例如正态分布、偏斜分布、双峰分布、多峰分布、梳状分布、边缘峰分布、狗粮分布和核心切割分布。所有这些不同的分布类型都可以用直方图来表示。

直方图可以有以下几种类型,包括:

  • 一致直方图
  • 对称直方图
  • 双峰直方图
  • 概率直方图

直方图的优点

直方图主要有用,因为它们简单且适应性强。它提供了对频率分布的深刻见解,并可应用于各种环境。例如,可应用于销售和市场营销,以制定最成功的定价策略和营销活动。

Advantages and Disadvantages of Histogram
  • 直方图可以图形化地显示大量难以在表格中呈现的数据。
  • 这使得显示不同类型和频率的数据更加简单。
  • 它有助于显示数据的分布。
  • 借助直方图可以确定数据的中位数、分布和方差。
  • 通过观察直方图,我们可以了解数据的偏斜度。
  • 此外,这些图表有助于预测流程未来的表现。
  • 这使得计算过程能力变得更容易。
  • 由于区间等距,直方图相当一致。
  • 从数据表中创建直方图很容易。
  • 借助直方图可以确定数据的标准差。
  • 使用此图形,可以确定图表的范围。
  • 直方图是一种读者易于理解的图表类型。阅读和理解它很简单。
  • 直方图通常以支持决策的方式绘制。
  • 当手头的数据分布在非常宽的范围内时,这些图表很有用。
  • 图示表示提供了数据概览。
  • 过程线变得易于理解。
  • 便于做出并传达决策。
  • 适用于制造业、服务业、学术界等众多领域。
  • 它是显示连续频率分布最常用和最受欢迎的工具之一。直方图可以让我们一眼对数据的分布和形状有一个大致的了解。
  • 在商业中,直方图广泛用于可视化营销活动和项目管理的数据。
  • Advantages and Disadvantages of Histogram
  • 直方图可以显示众数(Mode)值的图形位置。
  • 直方图比条形图的优点在于,底(矩形的底)和高(矩形的高)都具有重要意义并包含数值数据。相比之下,条形图是一维图形,只有长度(条形的高)很重要,而宽度是任意的。
  • 直方图的一个优势是可以表示许多代表不同类别间隔的条形,这使得它们比饼图更有优势。然而,饼图最多只能有五个或六个“切片”或类别,因为超过这个数量会导致不吸引人的视觉呈现。
  • 可以使用直方图绘制频率多边形。在首先绘制指定频率分布的直方图后,应通过直线图连接直方图相邻矩形顶部(上水平边)的中点。频率多边形就是这样得到的形状。

直方图的缺点

直方图的缺点包括它们非常关注“箱”(bins)或线的数量,并且对变量的最大值和最小值非常敏感。

Advantages and Disadvantages of Histogram

更改最大值和最小值可能会导致图形的外观发生巨大变化,这可能会产生误导。此外,它们的简单性使得理解数据的含义和分布变得困难。

  • 绘制直方图时,只能使用连续数据。
  • 在比较两种数据类型时,此图表类型有更好的选择。
  • 由于数据总是被分组或分类,因此不会使用数据的确切值进行绘图。
  • 除非绘制成频率分布,否则无法从图形中提取直方图的确切输入。
  • 直方图是可以轻松调整以支持预期结果的图表。
  • 绘制直方图时,有时可能会忽略数据点之间的时间差。
  • 它们可能更适合对许多不同类型的数据进行分组比较。
  • Advantages and Disadvantages of Histogram
  • 数据被分类到组中,因此无法读取确切值。
  • 比较两个数据集更具挑战性。
  • 仅适用于连续数据。
  • 使用区间,无法计算精确的中心趋势。
  • 假设您想用图片说明四种不同类型汽车的销量。由于 X 轴只能显示数值,因此直方图无法做到这一点。我们必须创建一个条形图来处理汽车类型等类别。
  • 直方图不能表示离散频率分布。它只能表示连续频率分布。
  • 与直方图相比,箱线图(boxplot)为我们提供了更多信息,例如数据的中位数、上四分位数和下四分位数,这是直方图的一个缺点。
  • Advantages and Disadvantages of Histogram
  • 无法使用直方图比较两个不同的数据集。但是,可以使用几个条形图来比较两个不同的数据集。
  • 虽然可以使用直方图计算众数,但不能用于计算均值或中位数。
  • 如果第一个开放类别的大小不等于后续(第二个)类别的大小,并且最后一个开放类别的大小不等于前一个(即倒数第二个)类别的大小。则无法为具有开放式类别的频率分布生成直方图。

结论

可以使用直方图以图形方式显示数据集或数据分布。直方图显示数据值的频率和重要数据量。因此,直方图有助于定位数据集的中位数和分布。它还可以显示数据集中存在的任何差距或异常值。


下一个主题Audacity-vs-garageband