直方图的优缺点2025年3月17日 | 阅读 7 分钟 直方图定义假设在制造业中,我们在确定生产是否达到特定目标以及在某些情况下是否具有足够价值方面面临着几项挑战。它可以成为一个有用的故障排除工具。要理解更频繁出现的数据,并检查任何给定分布中的数据密度。利用这一点,我们可以比较不同的设备、操作员、供应商等。 直方图由卡尔·皮尔逊发明,显示了连续数据的概率分布。 ![]() 频率分布显示数据集中每个唯一值出现的频率。直方图是表示频率分布最流行的图形类型。虽然它与条形图有许多相似之处,但存在显著差异。它是七种基本质量工具之一,是用于汇总和分析数据的有用工具。 直方图是一种可视化表示,使用条形图来显示数据值,以显示一系列等大小数值区间中数据项的频率。X 轴和 Y 轴分别显示区间大小和频率。每个条形的高度表示每个区间的大小频率。它以一种更容易识别过程的离散度和中心趋势的方式呈现数据。直方图使我们能够观察数据的分布和形状。当样本量大于 50 时,它最有效。 例如,在钢铁制造业中,质量检验员会询问在给定厚度范围内生产的钢板数量。它还可以用于确定该过程是否生产符合要求范围的钢板。此外,根据范围的不同,其结果可能更少或更多。 ![]() 同样,制药公司的质量检验员试图确定瓶盖是否拧紧。检查瓶子至关重要,因为如果它们拧得太松或太紧,它们可能会泄漏或难以打开。在这里,他可以选择一些瓶子样本,并指定打开瓶盖所需的扭矩值;假设是 20。要查看可视化表示,请在直方图中绘制数据。 条形图和直方图非常相似。此图结合了折线图和垂直条形图。在这种情况下,使用大小相等的矩形来显示数据。直方图用于显示数据或信息在连续时间段内的分布。变量的频率与矩形条的面积有关。 虽然直方图和条形图可能看起来相似,但直方图旨在表示连续数据,而条形图显示变量出现频率。箱(bins)用于对这些连续数据进行分类。使用这些容器,可以快速识别大多数和少数点。此外,在绘制直方图时,应注意不要使箱太窄,这可能会影响频率分布的流动,或太宽,这会使数据变化难以看到。 ![]() 直方图是按图形方式排列的连续类别的频率分布。它是一个面积图,可以定义为一组矩形,其底边代表类别边界之间的分隔,面积与相关类别中的频率成正比。由于底边覆盖了类别边界之间的空间,因此此类表示中的所有矩形都是相邻的。对于相似的类别,矩形高度与相应频率成反比;对于不同的类别,矩形高度与频率密度成反比。 直方图类型根据数据在频率上的分布方式,直方图可以分为多种类别。有许多不同的分布,例如正态分布、偏斜分布、双峰分布、多峰分布、梳状分布、边缘峰分布、狗粮分布和核心切割分布。所有这些不同的分布类型都可以用直方图来表示。 直方图可以有以下几种类型,包括:
直方图的优点直方图主要有用,因为它们简单且适应性强。它提供了对频率分布的深刻见解,并可应用于各种环境。例如,可应用于销售和市场营销,以制定最成功的定价策略和营销活动。 ![]()
![]() 直方图的缺点直方图的缺点包括它们非常关注“箱”(bins)或线的数量,并且对变量的最大值和最小值非常敏感。 ![]() 更改最大值和最小值可能会导致图形的外观发生巨大变化,这可能会产生误导。此外,它们的简单性使得理解数据的含义和分布变得困难。
![]() ![]()
结论可以使用直方图以图形方式显示数据集或数据分布。直方图显示数据值的频率和重要数据量。因此,直方图有助于定位数据集的中位数和分布。它还可以显示数据集中存在的任何差距或异常值。 |
我们请求您订阅我们的新闻通讯以获取最新更新。