GOMS 模型系列（KLM 和 CMN-GOMS）

2025年3月17日 | 阅读 7 分钟

GOMS 代表目标（Goals）、操作（Operators）、方法（Methods）和选择规则（Selection Rules）

在认知心理学和人机交互领域，GOMS（目标、操作、方法和选择规则）模型系列提供了一个框架，用于描述和分析完成任务所涉及的认知过程。在 20 世纪 80 年代，Card、Moran 和 Newell 开发了 GOMS 模型的第一版。GOMS 模型系列是随着时间的推移，对最初的 GOMS 模型进行修改和添加而产生的。

GOMS 模型为设计者提供了用户在完成常见任务时行为方式的表示。

目标

用户期望的结果被称为目标。从发布研究论文等高层目标可以分解出诸如删除单词等低层目标和子目标。因此，存在一个目标层级。

运算符

用户的活动被称为操作。这些可以是挥手等肌肉活动，查看设置等感知动作，或记住菜单项等认知行为。GOMS 中的操作是不能进一步细分的原子元素。

操作的执行时间是用户完成该操作所需的时间。通常使用概率分布、某些参数的函数或常数来估计。例如，Fitts 定律，一个目标大小和距离的函数，或者一个常数如 1.1 秒都可以用来近似鼠标指针的移动。

方法

用户完成目标的程序被称为方法。它们概述了用户为完成一个目标或子目标必须采取的一系列动作。你可以使用退格键或双击一个单词来删除它。

选择规则

当有多种完成目标的方式时，选择规则会选择采用哪种方法。例如，要删除一个单词，如果光标在单词末尾，则使用退格键；如果不在末尾，则双击该单词并选择删除。

GOMS 包含 2 个模型

键盘击键级别模型（Keystroke Level Model, KLM）
CMN-GOMS

1. 键盘击键级别模型 (KLM)

键盘击键级别模型（Keystroke Level Model, KLM）是 GOMS 的一个简化版本，它通过将任务分解为基本过程或键盘击键来估计任务执行时间。

它为许多类型的操作分配了不同的时间，包括单击按钮、拖动鼠标或思考。

键盘击键级别模型（Keystroke Level Model, KLM）是一个预测模型，在人机交互中用于确定完成给定任务所需的时间。它是 Stuart Card、Thomas Moran 和 Allen Newell 作为 GOMS（目标、操作、方法和选择规则）模型系列的一部分开发的。通过将作业分解为基本操作或键盘击键，并为每个动作分配不同的时间值，KLM 简化了建模过程。因此，它是在设计早期阶段估计项目完成时间的有用工具。

KLM 模型的作用

KLM 主要用于估计完成特定任务所需的时间。它将任务分解为离散的操作或键盘击键，并为每个操作分配时间值，从而提供对预期工作完成时间的量化估计。

通过估算用户在每种情况下完成任务所需的时间，KLM 使设计者能够比较不同的设计解决方案。借助这种比较分析，可以选择最有效和用户友好的设计。

KLM 的估算结果提供了关于各种功能或任务可能时间需求的初步信息，有助于资源分配和项目规划。这些信息可以帮助做出关于项目排程和资源分配的明智决策。

KLM 模型中的操作

键盘击键级别模型（Keystroke Level Model, KLM）使用“操作”（operators）一词来描述用户完成任务所使用的基本运动或认知功能。每个操作都分配有一个时间值，表示用户完成该特定动作通常所需的时间。KLM 使用一套标准化且相对基本的操作，以便于快速模拟任务完成时间。

K（键盘击键）

此操作表示用户按下键盘上的键所需的时间。该操作通常平均需要 0.2 秒才能完成。

P（指针设备）

指针设备操作表示用户使用鼠标等指针设备将指针移动到特定区域所需的时间。此操作的平均正常执行时间为 1.1 秒。

H（手从鼠标移到键盘）

此操作表示用户在完成指向任务后，将手从鼠标移到键盘所需的时间。该操作通常平均需要 0.4 秒才能完成。

M（心智操作）

心智操作表示用户为下一个动作进行心智规划或准备所需的时间。该操作考虑了认知处理时间。该操作的平均时间取决于心智工作的复杂程度。

B（按下按钮）

此操作表示用户按下鼠标按钮所需的时间。该操作通常平均需要 0.1 秒才能完成。

R（系统响应）

R 代表“系统响应”，表示计算机系统响应用户操作所需的时间。该操作的平均时间取决于系统的响应能力。

为了模拟系统反应时间（即从按下按键到屏幕上出现相应字符之间的时间间隔），KLM 最初定义了一个 R 操作。在 1980 年模型首次提出时，R 非常重要。然而，由于我们习惯了几乎瞬时的系统响应，它已不再使用，除非系统是网络化的，网络延迟可能会成为问题。

这些操作模拟了用户完成任务的顺序，分配给每个操作的时间总和决定了完成工作所需的总时间。KLM 特别适用于可以分解为一系列简单、离散动作的任务，因为它假设这些操作是顺序执行的。

2. CMN-GOMS

CMN-GOMS 作为一种理解和评估用户与计算机系统交互的系统化方法，对认知心理学和人机交互领域产生了重大影响。在更广泛的 GOMS 系列中，它已被扩展和修改，产生了包括键盘击键级别模型（KLM）、NGOMSL（自然 GOMS 语言）等在内的多种模型。这些模型有助于研究人员和设计者预测和评估用户界面的有效性和可用性。

CMN-GOMS 使用目标、操作、方法和选择规则这四个构造来模拟任务和用户行为。

目标： 指示用户的更高层次的认知目标。通过这种基于认知的任务组织，可以对认知过程进行分层建模。

操作： 这些是改变任务环境或用户心智（认知）状态的简单动作。这里的概念比键盘击键级别模型（KLM）中的操作更广泛。

方法： 为实现子目标而设计的目标-操作步骤的集合。方法是一种有序的方法，用于安排一系列动作以在更大的活动中实现特定目标。

选择规则： 当有多种方法可以实现特定目标时，则适用这些规则。这些规则提供了一种在特定交互设置中选择多种方法的方式，从而实现任务执行的灵活性。

在认知心理学和人机交互领域，这个包含四个构造的框架提供了一种系统化的方法来分析和建模用户交互，从而增进我们对任务执行中涉及的认知过程的理解。

GOMS family of models (KLM and CMN-GOMS)

CMN-GOMS 中的操作

KLM 和 (CMN) GOMS 中的操作在概念上具有相似性。

主要区别在于 KLM 只定义了七个操作。而 (CMN) GOMS 中的操作概念不限于这七个。

模型构建者可以定义任何“基本”的认知操作并将其用作操作。

在更高层次上，一个操作可以被定义为完成“通过选择关闭菜单选项来关闭文件”的整个认知过程。

(CMN) GOMS 允许在任何认知级别上定义操作，并且可以为模型的不同区域定义不同级别的操作。

由于其灵活性，(CMN) GOMS 可以模拟比 KLM 中预定义的运算符更广泛的认知操作，从而更细致、更详细地描述用户的认知过程。

与 KLM 的线性思维过程不同，(CMN) GOMS 假设的是一个分层的认知（思维）过程。在两种模型中都假设了完美“逻辑”且无错误的行为。(CMN) GOMS 的建模技术中包含了一个分层结构，可以更复杂、多层次地描绘任务和认知过程。因此，目标可以分解为子目标；方法可以由一系列子目标和操作组成，并且模型可以表示一个嵌套结构。由于其更强的灵活性和适应性，这种分层表示可以更好地传达任务执行中涉及的认知过程的多样性和相互关联性。

下一个主题Nielsen 启发式：10 个提高 UI 设计的可用性原则

GOMS 模型系列（KLM 和 CMN-GOMS）

目标

运算符

方法