SAS 术语2025年03月17日 | 阅读 9 分钟 在本 SAS 术语教程中,我们提供了一份重要的 SAS 术语列表,这些术语将在您学习 SAS 的过程中遇到。在开始 SAS 术语之前,您可以先修改 SAS 编程语言的概念。 在这里,我们将讨论在数据科学中有用且在 SAS 编程中使用的 SAS 术语。SAS 用于高级分析、预测分析、数据管理、商业智能和多变量分析。 不同的 SAS 术语![]() 访问描述符SAS 通过接口视图引擎与 IMS 数据库进行交互。接口视图引擎使用 SAS/ACCESS 描述符文件,该文件是通过 ACCESS 过程创建的。有两种描述符文件:
访问描述符访问描述符包含要使用的 IMS(信息管理系统)数据库的信息。数据库信息包括 IMS 字段名、数据库格式、数据库名、段名和长度、键字段以及默认 SAS 格式。访问描述符由字段的唯一处理标识组成,并指示一个实体在一个数据库段中出现多次或不出现。SAS/ACCESS 文件描述了 SAS 软件的数据,而这些数据存在于 PC 文件中。 访问描述符充当主描述符文件,因为它包含数据库的完整描述,而 IMS 不存储有关数据库的描述信息。 视图描述符视图描述符用于定义子集中的数据。它仅定义访问描述符所描述数据的子集。视图描述符在 SAS 程序中使用,用于直接读写 IMS 数据库中的数据。通过使用视图描述符,可以提取 IMS 数据并将其放入 SAS 数据文件中。 数据类型在表格中,每列都有一个属性和数据类型,该数据类型指示了操作环境、物理存储容量以及列中存在的数据类型(如 int、boolean、string 等)。 SAS 中只使用两种数据类型:实数和定长字符串。实数用于在内部以数字形式存储日期和时间,而字符始终以宏变量的形式存在。值应该用引号括起来,以将它们与其他语言元素(如变量)分开。 列它是 PC 文件的一个垂直组成部分,具有唯一的名称和特定类型的数据以及某些属性。列对应于 SAS 术语中的变量。 列函数列函数是对列的每个值进行计算的操作。例如,薪资是列的一个计算值,需要进行计算。 数据值在 SAS 软件中,数据值是在 SAS 数据集中呈现的字符或数值信息单元。数据值代表观测值中的一个变量。 浏览数据浏览数据是查看包含观测值的文件数据的过程。 文件文件是彼此以井井有条的方式组织起来的实体集合。每个记录被视为一个单元,并通过 SAS 软件进行控制。这些 SAS 文件在 SAS 数据库中进行处理和存储。 数据库管理系统 (DBMS)DBMS 是一个用于创建和操作数据的集成软件包。数据以关系表的形式存储在数据库中。 格式SAS 软件用于写入或显示每个变量值的指令称为格式。某些格式由 SAS 软件提供,其他格式由用户在基础 SAS 软件中使用 format 过程编写。 SAS 数据库SAS 数据库是以组织表格形式组织的相互关联的数据集合。在关系数据库管理系统中,数据库包含索引、视图和表等对象,以便以系统化的方式访问数据。 Engine (引擎)SAS 软件有很多部分,引擎是其中之一。引擎的职责是从文件中读取数据并写入文件。 索引SAS 索引的目的是优化“WHERE 子句”处理并促进 BY 组处理。我们还使用这些索引来优化 WHERE 子句处理并参与处理。 ![]() INFORMATINFORMAT 语句用于将一个 informat 与一个变量关联起来。我们可以指定 SAS 软件提供的标准 SAS informats 或用户定义的 informats,但两者都应预先在 PROC FORMAT 中定义。单个 INFORMAT 语句可以将同一个 informat 链接到多个变量,或将不同的 informats 链接到多个变量。如果一个变量出现在多个 INFORMAT 语句中,则 SAS 使用最后分配的 informat。 INFORMAT variable-1 <...variable-n> INFORMAT 语句定义了之前未定义的字符变量的长度,以便您可以在 DATA 步中缩短字符变量的值,前提是 INFORMAT 语句出现在 SET 语句之前。 LibrefLibref 是临时链接到 SAS 数据库的名称。例如 - 在 SASUSERS.ACCOUNTS 名称中,SASUSER 是一个 Libref。您使用 LIBNAME 语句或操作系统控制语言分配 libref。 成员SAS 数据库中的 SAS 文件称为成员。 成员名SAS 数据库的 SAS 文件名称为成员名。 成员类型成员类型标识 SAS 文件的信息类型。成员类型包括 DATA、ACCESS、CATALOG、VIEW 和 PROGRAM。 缺失值SAS 软件中的缺失值表示当前观测值中变量没有存储数据。默认情况下,SAS 软件用单个点表示缺失的数值,而空格表示缺失的字符值。 观察观测值是 SAS 数据文件的水平组成部分。观测值数据是与单个实体(如客户)关联的值的集合。每个观测值包含数据文件中每个变量的数据值。观测值与 PC 文件中的行一致。 PROC SQL 视图PROC SQL 视图是由 PROC SQL 创建的 SAS 数据集。它属于视图,因为它是视图的一部分。PROC SQL 视图不包含任何数据。它仅用于存储查询表达式,该查询表达式从其底层文件中读取数据值。底层文件包括 SAS 数据文件、SAS/ACCESS 视图、数据步视图或其他 PROC SQL 视图。执行时,PROC SQL 视图的输出可以是其中一个或多个底层文件的超集或子集。 记录记录与 SAS 观测值一致。 关系数据库管理系统 (RDBMS)关系数据库管理系统是一种根据数据实体之间的关系来组织和访问数据的数据库。 SAS 行行是 PC 文件的水平组成部分。每一行对应一个 SAS 观测值。 SAS 数据文件SAS 数据文件是一种 SAS 数据集,它同时包含数据值和描述符信息。SAS 数据文件与数据相关联,例如变量的属性。 SAS 数据文件有两种类型:原生 SAS 数据文件和接口 SAS 数据文件。 原生 SAS 数据文件 以 SAS 格式化的文件存储数据值和描述符信息。 接口 SAS 数据文件接口 SAS 数据文件用于将数据存储在 SAS 软件以外的软件格式化的文件中。SAS 软件的引擎读取和写入由其他软件(如 DB2、Oracle、Sybase、ODBC、BMDP、OSIRIS 和 SPSS)格式化的文件中的数据。 这些格式化的文件被视为接口 SAS 数据文件,当引擎访问其数据值时,SAS 会将它们识别为 SAS 数据集。
"客户站点许可协议始终决定访问不同类型接口数据文件的引擎的可用性。要查看引擎的可用性,请咨询您的系统管理员。" SAS 数据库SAS 数据库是 SAS 软件识别的一个或多个 SAS 文件的集合,这些文件可以作为一个整体进行引用和存储。每个文件都是库的重要组成部分,并被视为一个成员。 SAS 数据库有助于您组织工作。例如,如果一个 SAS 程序使用多个 SAS 文件,您可以将所有文件保存在一个库中。将文件组织在库中可以方便地查找文件并在程序中引用它们。 在大多数操作系统环境中,SAS 数据库与操作系统组织文件的方式高度匹配。例如,在基于目录的操作系统环境中,SAS 数据库是同一目录中的一组 SAS 文件。该目录可能包含其他文件,但只有 SAS 文件被视为 SAS 数据库的一部分。 操作系统信息 在 CMS 操作系统环境中,SAS 数据库是同一类型文件的集合。在 Z/OS 操作系统环境中,SAS 数据库是特意格式化的 z/OS 数据集。这些数据集只能包含 SAS 文件。 SAS 数据集SAS 数据集是存储在 SAS 库中的 SAS 文件。它由 SAS 软件创建和处理。SAS 数据集包含以观测值(行)和变量(列)表格形式组织的数据值,SAS 软件可以处理这些数据。SAS 数据集还包含描述性信息,如变量的数据类型和长度,以及创建数据的引擎。SAS 数据集可以是 SAS 数据和 SAS 视图之一。 SAS 数据SAS 数据同时包含描述符信息和数据。SAS 数据的成员类型是文件。 SAS 数据视图SAS 视图是一种 SAS 数据集,它从其他文件中检索数据值。SAS 视图仅包含描述符信息,如变量(列)的数据类型和长度。它还包含从其他 SAS 数据集或其他软件供应商的文件格式中获取数据值所需的附加信息。SAS 数据视图是 VIEW 类型之一。如果 SAS 视图包含 SAS 数据文件的属性,则可以使用它。 SAS 视图有两种类型: 原生视图原生视图是通过 PROC SQL 或 DATA 步创建的 SAS 视图。 接口视图接口视图是使用 SAS/ACCESS 软件创建的 SAS 视图。接口视图用于读取或写入数据库管理系统(DBMS),如 Oracle 或 DB2。接口视图可称为 SAS/ACCESS 视图。使用 SAS/ACCESS 软件需要拥有其许可证。 结构化查询语言 (SQL)SQL 是一种用于创建和操作关系数据库管理系统数据的 HLL 查询语言。SAS 软件使用 SQL 过程来实现数据库中的数据对象。 表别名表别名是在 FROM 子句中指定的表的临时替代名称。当我们连接表时,我们交替使用表别名来限定列名。 表查找表查找是一种处理技术,其中根据主源中的变量值从辅助源获取信息。 变量变量是 SAS 数据集中的列,也是描述所有观测值给定属性的数据值集合。在 ACCESS 过程中,变量是从 PC 文件或字段的列创建的。 目标变量目标变量是函数或表达式结果被赋给的变量。 |
我们请求您订阅我们的新闻通讯以获取最新更新。