描述性统计与推论性统计的区别

2025年3月17日 | 阅读 7 分钟

数据分析的基础是统计学。它是数学的一个分支,使我们能够识别海量数值数据中的模式和趋势。描述性统计和推断性统计是统计方法的两大类。在本文中,我们将探讨描述性统计和推断性统计之间的区别,以及它们如何影响数据分析。有趣的是,虽然目标可能不同,但某些测量方法是相似的。因此,让我们来研究一下主要的区别。

Difference between Descriptive and Inferential Statistics

描述性统计

描述性统计(作为可数名词)是数值上描述或总结数据集合特征的汇总统计量,而描述性统计(作为不可数名词)是这些统计量的使用和分析。

通过专注于总结样本,而不是使用数据来推断样本数据所代表的人口统计特征,描述性统计与推断性统计(或归纳统计)区分开来。这本质上意味着描述性统计通常是非参数统计,并且与推断性统计不同,它们不是建立在概率论的基础上的。

Difference between Descriptive and Inferential Statistics

即使在使用推断性统计来推导数据分析的主要结论时,通常也会提供描述性统计。例如,一份关于人类受试者的论文通常会包含一个表格,其中包含总样本组、重要亚组的样本量(例如,每个心理治疗或暴露组)以及人口或临床特征,例如平均寿命、每个性别的受试者百分比、具有相关合并症的受试者百分比等。

集中趋势指标和变异或离散度测量是描述数据集的两个常用指标。而标准误差(或方差)、变量的最大值和最小值、峰度和偏度被用作变异性度量,均值、中位数和众数被用作集中趋势指标。

描述性统计提供了样本和已得出结论的简洁摘要。这些摘要可以是定量的,如汇总数据,也可以是可视化的,如易于阅读的图形。这些摘要可以作为更深入的数据分析中初步概述信息的依据,或者它们本身足以满足特定调查的需求。例如,在篮球运动中,描述性统计量(如投篮命中率)可以总结球员或球队的表现。

该数字是投篮次数与总出手次数的比值。例如,投篮命中率为 33% 的球员大约每三次出手命中一次。百分比枚举或描述了许多不同的事件。还可以考虑你的平均绩点。这个数字总结了学生在所有教育经历中的整体表现。

事实上,人口和经济数据的基本制表就是统计概念的起源。描述性和汇总统计有着悠久的实际应用历史。箱线图是最近被归类为探索性数据分析领域的一种汇总技术。描述性统计为商业部门的多种类型数据提供了有用的总结。例如,投资者和经纪人可以通过对其资产进行经验性和分析性评估,利用历史回报行为记录来做出更好的投资决策。

描述性统计的类型

描述性统计有两种类型:集中趋势度量和变异度度量,通常称为离散度度量。

集中趋势

变异度度量侧重于数据的分散程度,而集中趋势度量侧重于数据集的平均值或中心值。为了帮助理解所研究数据的重要性,这两种度量都利用了图表、表格和一般性陈述。

集中趋势度量描述了给定数据集的分布的中心位置。通过众数、均值或中位数,检查分布中每个数据项的频率,这些度量可以衡量所研究数据集的普遍模式。

变异度度量

变异度度量,也称为离散度度量,是评估数据集分布分散程度的工具。例如,虽然集中趋势度量可以为数据集提供一个估计值,但它并没有表明数据集中数据的分布情况。

因此,即使数据的平均值可能是 100 分中的 65 分,但数据点仍可能在 1 到 100 之间。通过定义数据集的布局和分布,变异度度量有助于传达这一点。变异度度量的例子包括范围、上四分位数、绝对方差和偏差。

推断性统计

Difference between Descriptive and Inferential Statistics

推断性统计是一门统计学分支,它利用各种分析技术,根据样本信息推断总体信息。除了推断性统计,描述性统计也是统计学的一个领域。描述性统计提供对数据集特征的总结,而推断性统计则有助于得出关于总体的结论。回归分析和假设检验是推断性统计的两个主要子类型。推断性统计要求使用的样本能够代表总体。

通过研究从总体数据中提取的样本,推断性统计有助于对数据形成深刻的理解。通过利用各种分析技术和工具,它有助于形成总体级别的概括。为了选择准确反映总体的随机样本,采用了许多抽样程序。简单随机抽样、整群抽样、分层抽样和目的抽样是一些关键方法。

一位统计学家使用分析工具通过分析随机抽取的样本来推断有关社区的细节,这就被称为从事推断性统计。推断性统计的目的是对总体进行概括。在使用推断性统计时,利用样本数据中的一个统计量(例如样本均值)来对样本统计量(例如总体均值)得出结论。

由于它可以在不收集所有可用数据的情况下得出总体结论,因此推断性统计非常有帮助且经济高效。以下是一些推断性统计的例子

  • 假设你知道某个国家 100 名参与者的平均成绩。可以使用推断性统计来估计该国学生的平均分数。
  • 假设一位教练想了解他学校一年级学生在停止前平均可以做多少个单脚旋转。当中小学的代表完成侧手翻时,将计算中位数。基于这些信息,推断性统计将就二年级学生平均可以完成的侧手翻次数做出判断。

推断性统计的类型

假设检验和回归分析是推断性统计的两类。在假设检验期间可以使用置信区间来检验总体参数。以下是各种推断性统计的列表。

假设检验

检验假设并从现有样本数据中对社区进行概括都是推断性统计的例子。需要创建一个无效理论和假设检验,然后执行显著性统计检验。通过检验统计量的值、结果是否显著以及置信区间来得出结论。假设检验可以有左尾、右尾或双尾分布。

置信区间

置信区间在确定总体的参数方面很有用。例如,95% 的置信区间意味着在相同条件下进行的 100 次新样本测试中,有 95 次估计值将落在指定范围内。在假设检验中,也可以使用置信区间来确定临界值。除了这些检验之外,方差分析 (ANOVA) 检验、Kendall 符号检验、Mann-Whitney U 检验、方差分析 H 检验等也是推断性统计中使用的其他检验?

回归分析

回归分析用于计算一个因素相对于另一个因素的变化方式。有许多回归模型可供使用,包括简单线性回归、非线性回归、名义回归、sigmoid 回归和有序回归。在推断性统计中,线性回归是最常用的回归类型。线性回归通过研究因变量对自变量单位变化的响应来分析。

描述性统计与推断性统计的区别

描述性统计推断性统计
提供有关原始数据的信息,这些信息以某种方式描述了数据。使用从总体中获得的数据来得出关于总体的结论。
它有助于数据的收集、组织、分析和有意义的呈现。它使我们能够比较事实、形成假设和做出预测。
它被用来描述一种情况。它被用来解释事件发生的可能性。
它仅限于小样本量或总体,并解释已知的事实。它试图得出关于总体的结论。
可以使用表格、图表、图形和其他视觉辅助工具来完成。概率可以帮助实现它。

结论

描述性统计提供了样本和结果的简要摘要。这些摘要可以是定量的,例如汇总数据,或可视化的,例如易于理解的图形。这些摘要本身就足以满足特定调查的需求,或者它们可能作为更深入数据分析中数据初步概述的基础。推断性统计是统计学的一个分支,它利用一系列分析方法,基于数据集合来推断关于总体的知识。除了推断性统计之外,还有其他类型的统计学。描述性统计总结了数据集的属性,而推断性统计则有助于推断关于总体的结论。


下一主题区别