数据集

17 Mar 2025 | 4 分钟阅读

SAS 中的特殊和内置数据集

在上一主题中,我们学习了 SAS 编程的程序结构,并了解到数据是任何数据集的主要组成部分和构建块。在本主题中,我们将学习 SAS 数据集的组成部分;同时,我们将讨论一些数据集示例,以找出 SAS 编程中数据集的定义。

数据集基本上是变量及其值的组合,这些值也称为数据值或观测值。数据集以表格的形式包含和组织数据值。在 SAS 术语中,行称为观测值,列称为 SAS 变量。

我们还可以将 SAS 数据集定义为存储在 SAS 库中的 SAS 文件。 SAS 文件由 SAS 创建和存储。

以下是数据集 STPSAMP.STPSALE 的展示,它在 SAS 中的外观

SAS Data Set

列(或变量)

每一列代表 SAS 表中的一个变量。在上图中,region、citysize、pop、product 和 saletype 是列或变量。

观测值(或行)

每一行代表 SAS 数据集表格表示中的一个观测值。在上图中,region:NC、NE、SO、WE 等。citysize:S、M 和 L pop:25000、37000、48000、32000 等。product:A100 和 saletype:R 都是观测值。

SAS 数据集的组成部分

数据集由描述符部分、数据部分、特殊 SAS 数据集和内置数据集组成。让我们详细了解一下它们。

描述符部分

数据集的描述符部分包含有关上次修改的时间和日期、数据集中观测值和变量的数量等重要信息。将下表视为 SAS 数据集的描述符部分的一个示例,其名称为 work.grad。

SAS Data Set

数据部分

数据部分由 SAS 数据集的数据值组成。这些数据值以表格的形式排列。列包含变量,行包含这些变量的观测值。下面是它的描述。

假设有一个数据集是学生

学号名称Class高度
101Subhash12155
102Namrita10154
103Preeti12156
104Sushma10153

在数据部分的示例中,SAS 数据集有四个变量(学号、姓名、班级和身高),每个变量都有四个观测值,例如学号的数据值为 101、102、103 和 104,姓名的数据值为 subhash、namrita、Preeti 和 sushma,班级的数据值为 12、10、12 和 10,身高的数据值为 155、154、156 和 153。整个表称为数据集,变量和观测值的组合是数据值。 SAS 数据能够存储任意数量的变量和观测值。

特殊数据集

NULL 数据集

有时,我们可能希望执行任何数据步骤,但我们不想创建任何数据集,在这种情况下,我们可以使用 _NULL_。以下语句创建了一个不创建任何数据集的数据步骤。

语法

默认数据集

SAS 能够使用保留字 _LAST_ 来记住最后一个数据集。如果您在未声明数据集的情况下执行 DATA 或 PROC 步骤,则默认情况下 SAS 使用最后一个已执行的数据集。这称为默认数据集。

语法

自动命名约定

如果我们没有给 SAS 数据集命名或保留名称 _NULL_,SAS 会自动使用名称 DATA1、DATA2 等来创建它们。 这些自动生成的数据集存储在库中。此功能称为数据命名约定。

语法

4. SAS 内置数据集

SAS 软件中存在一些数据集,这些数据集已在 SAS 库中提供,可用于运行、分析和计算示例程序。所有数据集都存储在 SASHELP 下的我的库中。

SAS Data Set

现在,我们要使用名为 CARS 的数据集,双击它,SAS 窗口右侧将打开一个窗格。下图显示了 CARS 数据集,该数据集是 SAS 库中的一个内置数据集。

SAS Data Set

所以,这就是关于数据集的全部内容。 我们以一种简单的方式进行了说明,但如果您仍然有任何疑问,请随时在联系部分提问。


下一个主题SAS 中的 PROC 排序