SAS-频数分布

2025年3月17日 | 阅读 3 分钟

SAS 频数分布是 SAS 编程中最常用的统计程序。

描述性统计,如均值和标准差,可用于连续变量来汇总数据,但在分类变量的情况下,描述性统计不适用。

我们可以使用频数表来汇总分类变量,但在继续之前,让我们首先了解分类变量。

分类变量

纯粹的分类变量是指那些允许我们分配类别,但不允许我们按特定顺序排列它们的变量。换句话说,分类变量是指具有两个或更多类别的变量,但这些类别之间没有顺序。

例如,性别是一个分类变量,它包含两个类别,即男性和女性,但这两个类别之间没有顺序。另一个例子是头发颜色,也被认为是一个分类变量,因为它包含几个类别,即黑色、棕色、棕褐色、红色等。同样,我们无法按特定顺序排列它。

频数表

频数表显示变量每个类别中观察到的案例的数量和百分比。

频数表中的每个条目都包含特定区间内值的出现次数。

现在,让我们了解如何在 SAS 编程语言中实现频数分布操作。

PROC FREQ

我们可以使用PROC FREQ过程来计算变量的观察值的频数分布。

语法

其中,

  • 数据集: 这是将用于频数分布的数据集的名称。
  • 变量1: 这是需要计算其频数分布的变量的名称。
  • 变量2: 这是用于对频数分布结果进行分类的变量。

SAS PROC FREQ 的用法

PROC FREQ 的主要目的是我们可以计算任何用户定义或已有的或 SAS 内置帮助库数据集的频数。 为了计算频数分布,我们只需要指定数据集的名称。

示例

在 SAS Studio 中执行以下代码

SAS-Frequency Distribution

输出

SAS-Frequency Distribution

单变量频数分布

可以使用 PROC FREQ 过程确定单个变量的频数分布。 在实现 PROC FREQ 过程后,结果将显示变量的每个包含的观察值的频率。 它还将显示百分比分布、累积频率和累积百分比

示例

在本例中,我们将计算数据集 CARS1 中变量“马力”的频数分布,该数据集是从 SAS 帮助库的现有数据集 CARS 创建的。

在 SAS Studio 中执行以下代码

SAS-Frequency Distribution

输出

SAS-Frequency Distribution

多变量频数分布

可以使用 PROC FREQ 过程确定多个变量的频数分布。 在实现 PROC FREQ 过程后,结果将显示所有变量的每个包含的观察值的频率。 它还将显示所有变量的百分比分布、累积频率和累积百分比。 让我们通过一个例子来了解这个过程的实现。

示例

在本例中,我们将计算两个变量的频数分布,第一个变量是make,另一个是type。 这两个变量都属于数据集 CARS1,该数据集是从 SAS 帮助库的现有数据集 CARS 创建的。

在 SAS Studio 中执行以下代码

SAS-Frequency Distribution

输出

SAS-Frequency Distribution

带权重的频数分布

在频数分布中,权重选项用于使用变量的权重来计算有偏频数分布。

示例

在下面的例子中,我们将计算变量maketype的频数分布,并分配马力权重。 让我们通过代码来理解一下

当我们在 SAS Studio 中执行上述代码时,我们将得到以下输出

SAS-Frequency Distribution
SAS-Frequency Distribution
下一个主题SAS-标准差