格式化数据集

17 Mar 2025 | 阅读 2 分钟

有时我们更喜欢将分析后的数据以不同于数据集中原始格式的方式呈现。例如,在一个文本变量中,所有文本值都是小写,我们希望将这些值表示为大写。或者我们需要在一个包含价格信息的变量中添加小数位数。为此,SAS 提供了 FORMAT 语句。

FORMAT 语句包含 SAS 内置格式。我们可以应用 FORMAT 语句使用内置格式和 PROCFORMAT 用于用户定义的格式。

语法

其中,

  • FORMAT: 这是一个 FORMAT 语句,指示格式化操作。
  • 变量名: 这是需要格式化的变量的名称。
  • 格式名称: 这是一个应用于变量的 SAS 内置格式的名称。

示例

让我们考虑 SAS 数据集 employee,其中包含组织员工的详细信息。在这里,我们需要以大写形式显示员工的姓名,为此,我们使用 FORMAT 语句 upcase9,这是 SAS 内置格式。

在 SAS studio 中执行上述代码

Format Data Sets

输出

Format Data Sets

正如您在输出中看到的那样,所有员工的姓名都已转换为大写。

使用 PROC FORMAT

PROC FORMAT 用于格式化用户定义的数据。我们可以根据我们的要求格式化数据值或观测值。在下面给出的示例中,我们应用了内置和用户定义的格式语句。

内置格式 upcase9 用于将小写文本转换为大写。对于用户定义的格式,我们将变量 dept 的值从缩写更改为扩展形式,即 IT = 信息技术和 HR=人力资源。

在 SAS studio 中执行上述代码

Format Data Sets

输出

Format Data Sets

正如您在输出中看到的那样,所有员工的姓名都已转换为大写,并且部门的缩写已转换为扩展形式。


下一主题SAS-SQL