什么是标准差?

2025年3月17日 | 阅读 3 分钟

在通用数学中,标准差是由特定公式计算出的一个数字。它用于表示一个集合的数学值与其平均值或平均值之间的差异程度。

标准差的低值表示数字非常接近平均值。标准差的高值表示数字远离平均值。

什么是 SAS 标准差?

在 SAS 中,标准差是一个基本的统计过程,用于衡量数据集中数据的变化程度。

SAS-Standard deviation

从数学上讲,它通过计算数据集中的每个值距离数据集的平均值或平均值的远近来衡量。

  • 如果标准差的值接近 0,则表示数据点非常接近数据集的平均值。
  • 如果标准差的值很高,则表示数据点分布在很宽的范围内,并且远离平均值。

现在我们将学习通过哪些过程可以将标准差应用于我们的数据。此外,我们还将看到衡量 SAS 标准差的不同方法。

在 SAS 中,标准差值通过两种方法衡量,如下所示

  • PROC MEANS
  • PROC SURVEYMEANS

PROC MEANS

我们可以使用 PROC means 衡量标准差,但为此,我们还需要在 PROC 步骤中选择 STD(标准差)语句。STD 语句从数据集中提取每个数值变量的所有标准差值。

语法

其中,

  • 数据集: 这是数据集的名称。

示例

在以下示例中,我们将从 SAS 帮助库中已有的数据集 CARS 创建数据集 CARS1,并在 PROC means 步骤中选择 STD 语句。

在 SAS Studio 中执行以上代码

SAS-Standard deviation

输出

SAS-Standard deviation

正如我们在上面的输出中看到的,Acura 和 Buick 的所有标准差值都已在表格中显示。这些值用于高级数据分析。

PROC SURVEYMEANS

此过程还用于计算标准差以及一些高级功能,例如衡量分类变量的标准差。它还提供数据集方差的估计值。

其中,

  • BY: 这些变量用于创建观察组。
  • CLASS: 这些变量用于分类变量。
  • VAR: 这些是计算 SD 的变量。

现在,让我们看一下 PROC SURVEYMEANS 的高级功能

过程 PROC SURVEYMEANS 使用两个语句来提供高级功能

  • Class 语句
  • By 语句

Class 语句

Class 语句为类变量中的每个值创建统计信息。

示例

以下代码描述了 class 语句的用法。

在 SAS Studio 中执行以上代码

SAS-Standard deviation

输出

SAS-Standard deviation

By 语句

By 语句用于在 By 语句下声明的变量的基础上创建组。

示例

以下代码描述了 By 语句的用法

当我们在 SAS Studio 中执行以上代码时,它将生成以下输出

make = "Audi" 的结果

SAS-Standard deviation

make = "BMW" 的结果

SAS-Standard deviation

make = "Acura" 的结果

SAS-Standard deviation
下一主题算术平均值