SAS-频数分布2025年3月17日 | 阅读 3 分钟 SAS 频数分布是 SAS 编程中最常用的统计程序。 描述性统计,如均值和标准差,可用于连续变量来汇总数据,但在分类变量的情况下,描述性统计不适用。 我们可以使用频数表来汇总分类变量,但在继续之前,让我们首先了解分类变量。 分类变量纯粹的分类变量是指那些允许我们分配类别,但不允许我们按特定顺序排列它们的变量。换句话说,分类变量是指具有两个或更多类别的变量,但这些类别之间没有顺序。 例如,性别是一个分类变量,它包含两个类别,即男性和女性,但这两个类别之间没有顺序。另一个例子是头发颜色,也被认为是一个分类变量,因为它包含几个类别,即黑色、棕色、棕褐色、红色等。同样,我们无法按特定顺序排列它。 频数表频数表显示变量每个类别中观察到的案例的数量和百分比。 频数表中的每个条目都包含特定区间内值的出现次数。 现在,让我们了解如何在 SAS 编程语言中实现频数分布操作。 PROC FREQ我们可以使用PROC FREQ过程来计算变量的观察值的频数分布。 语法 其中,
SAS PROC FREQ 的用法PROC FREQ 的主要目的是我们可以计算任何用户定义或已有的或 SAS 内置帮助库数据集的频数。 为了计算频数分布,我们只需要指定数据集的名称。 示例 在 SAS Studio 中执行以下代码 ![]() 输出 ![]() 单变量频数分布可以使用 PROC FREQ 过程确定单个变量的频数分布。 在实现 PROC FREQ 过程后,结果将显示变量的每个包含的观察值的频率。 它还将显示百分比分布、累积频率和累积百分比。 示例在本例中,我们将计算数据集 CARS1 中变量“马力”的频数分布,该数据集是从 SAS 帮助库的现有数据集 CARS 创建的。 在 SAS Studio 中执行以下代码 ![]() 输出 ![]() 多变量频数分布可以使用 PROC FREQ 过程确定多个变量的频数分布。 在实现 PROC FREQ 过程后,结果将显示所有变量的每个包含的观察值的频率。 它还将显示所有变量的百分比分布、累积频率和累积百分比。 让我们通过一个例子来了解这个过程的实现。 示例在本例中,我们将计算两个变量的频数分布,第一个变量是make,另一个是type。 这两个变量都属于数据集 CARS1,该数据集是从 SAS 帮助库的现有数据集 CARS 创建的。 在 SAS Studio 中执行以下代码 ![]() 输出 ![]() 带权重的频数分布在频数分布中,权重选项用于使用变量的权重来计算有偏频数分布。 示例在下面的例子中,我们将计算变量make 和type的频数分布,并分配马力权重。 让我们通过代码来理解一下 当我们在 SAS Studio 中执行上述代码时,我们将得到以下输出 ![]() ![]() 下一个主题SAS-标准差 |
我们请求您订阅我们的新闻通讯以获取最新更新。