预测 LL(1) 分析器

2025 年 7 月 15 日 | 阅读 7 分钟

在本文中，我们将通过各种示例来理解预测 LL(1) 解析器的概念。

引言

在 LL(1) 中，第一个 L 意味着输入是从左到右扫描的，下一个 L 意味着它使用最左推导，而 1 表示预测解析过程的超前符号。

如果它是非递归类型，则它是一种自顶向下的解析算法。在这种类型的解析中，会创建一个解析表。这是实现递归下降解析的有效方法。

在这种语法中，解析过程中将预测非终结符扩展的正确选项。因此不需要回溯。

预测 LL(1) 解析器的组成部分

以下是预测 LL(1) 解析器的各种组成部分的列表

输入缓冲区

输入缓冲区保存要由解析器处理的输入符号。它提供了一种前瞻机制，允许解析器检查下一个输入符号而不使用它。它包含要解析的字符串，后跟一个结束标记$，该标记表示字符串的结尾。

下图表示输入缓冲区的运作方式。

在上图中，输入缓冲区显示为终结符和非终结符的集合。输入缓冲区的末尾用“$”符号标记。基于解析堆栈的顶部和当前的输入符号，解析表指示解析器的操作。解析器要处理的下一个输入符号由输入缓冲区中的箭头符号指示。当解析器从输入缓冲区读取符号并处理每个符号直到标记的末尾时，箭头向右移动。

Stack

它也被称为解析堆栈，解析器用它来跟踪当前状态。它在堆栈底部包含“$”。在解析开始时，堆栈由语法的初始符号组成，后跟$。

预测解析表

这是一个用于预测解析的数据结构。它将非终结符和超前符号的组合映射到产生式规则。

下表将解析表表示为行和列的组合。行表示非终结符，列表示终结符和($)。

解析表

	a	b	$
S
A
B

解析器的运作方式

解析程序读取堆栈顶部和当前的输入符号，然后确定解析动作。

堆栈顶部	输入	操作
$	$	解析成功
a	a	从堆栈中弹出 a 并将超前移动到下一个标记
a	ε	Error
A	a	如果该单元格中的条目为空，则参考 M[A,a] 中的表，表示错误。
A	a	如果 M[A,a] 的条目是 A -> PQR，则弹出 A，然后压入 R，然后压入 Q，最后压入 R。

构建预测 LL1 解析器的步骤

它基于两个函数，例如 FIRST 和 FOLLOW。

为了构建 LL(1) 解析器，我们必须遵循以下步骤

步骤 1：在第一步中，检查所有重要条件，例如语法不包含左递归，语法不应模棱两可且进行左因子分解。

步骤 2：然后计算语法中所有非终结符的 first 和 follow 函数。

步骤 3：使用 FIRST 和 FOLLOW 函数创建一个谓词解析表。对于语法中的每个产生式规则 A --> α。

找到 First(α)，并对于 First(α) 中的每个终结符，在表中创建一个条目 A --> α。
如果 First(α) 有 ε 作为终结符，则找到 Follow(A)，并对于 Follow(A) 中的每个终结符，在表中创建一个条目 A --> ε。
如果 First(α) 有 ε 并且 Follow(A) 有 $ 作为终结符，则在表中为 $ 创建一个条目 A --> ε。

步骤 4：在最后一步中，借助解析表解析输入字符串。

示例 1：以具有一组产生式规则的以下语法为例

A -> A + B | B
B -> B * C | C
C -> (E) | id 

解决方案

步骤 1：在第一步中，检查所有重要条件，例如语法不包含左递归，语法不应模棱两可且进行左因子分解。

上述语法包含左递归。因此，在删除后考虑以下语法

A -> BA’
A’ -> +BA’/ε
B -> CB’
B’ -> *CB’/ε
C -> (ε)/id 

步骤 2：计算上述语法的 First 和 Follow 集

下表表示语法的 First 集。

非终结符	First()
A	{(, id)}
A'	{+, ∈}
B	{*,∈}
B'	{(,id)}
C	{(,id}

下表表示语法的 Follow 集。

非终结符	Follow()
A	{$,)}
A'	{$,)}
B	{$,+,)}
B'	{+,),$}
C	{+,),$,*}

步骤 3：之后，构建预测 (LL1) 解析表。

	id	+	*	(	)	$
A	A -> BA’			A -> BA’
A'		A’ -> +BA’			A' --> ε	A' --> ε
B	B -> CB’			B -> CB’
B'		B' --> ε	B’ -> *CB’		B' --> ε	B' --> ε
C	C --> id			C --> (E)

什么是 FIRST 函数？

First 函数是首次出现在 alpha 推导中右侧的终结符的集合。

示例 1：考虑以下语法并计算 FIRST 函数。

产生式规则集是

A -> BA’
A’ -> +BA’/ε
B -> CB’
B’ -> *CB’/ε
C -> (ε)/id 

解决方案

终结符集是：id, *, +, ε, (, )

非终结符集是：A, A’, B, B’, C

上述语法的 first 和 follow 如下所示

找到“A”的 first。

A -> BA’

在上面的规则中，产生的右侧是非终结符，所以我们转到下一个产生式规则 B -> CB'，其中第一个元素又是非终结符，所以我们转到下一个产生式规则 C->(ε)/id，其中第一个元素是终结符，这将是 A 的 first。

找到“A’”的 first。

A’ -> +BA’/ε

在上面的规则中，产生的右侧是非终结符，所以我们转到下一个产生式规则 B -> CB'，其中第一个元素又是非终结符，所以下一个产生式规则 C->(ε)/id，其中第一个元素是终结符，这将是 A' 的 first。

找到“B”的 first。

B -> CB’

在上面的规则中，产生的右侧是 C，它是一个非终结符，但我们必须找到终结符，所以我们转到下一个产生式规则 C->(ε)/id，其中第一个元素是终结符，这将是 B 的 first。

找到“B’”的 first。

B’ -> *CB’/ε

在上面的规则中，产生式 C 的右侧是非终结符，但我们必须找到终结符，所以我们转到产生式规则 C->(ε)/id，其中第一个元素是终结符，这将是 B' 的 first。

找到“C”的 first。

C->(ε)/id

在上面的规则中，第一个元素是终结符，这将是 C’ 的 first。

非终结符	First()
A	{(, id)}
A'	{+, ∈}
B	{*,∈}
B'	{(,id)}
C	{(,id}

什么是 Follow 函数？

这是可以显示在产生式的非终结符右侧的终结符的集合。

找到“A”的 follow

A -> BA’

在上述产生式规则中，我们找到 C 在产生式的右侧的产生式，即

B -> CB’

C->(ε)/id

因此，follow 将是下一个非终结符，后跟终结符 ')’，并且在 follow 中，始终添加“$”。 (A) 的 follow 是 ={$,)}

注意：通过使用上述方法来计算其他非终结符的 follow。

非终结符	Follow()
A	{$,)}
A'	{$,)}
B	{$,+,)}
B'	{+,),$}
C	{+,),$,*}

FIRST 和 FOLLOW 函数在 LL(1) 解析中的重要性

这两个函数在 LL(1) 解析和语法分析中都起着重要作用，具有许多重要的应用

创建 LL(1) 解析表

这有助于创建 LL(1) 解析器使用的解析表。

确保语法是 LL(1)

如果解析表中没有任何非终结符和输入符号的重叠条目，我们可以检查语法是否满足 LL(1) 条件。

持有 ε 产生式

当可以获得非终结符 ε 时，FIRST 集中包含空字符串。

预测解析的局限性

预测解析的各种局限性如下

回溯：它不支持回溯，这意味着它无法更改基于输入的决策。
难以处理模棱两可的语法：它无法直接处理歧义，因为它在处理模棱两可的语法时会遇到一些困难，其中单个输入可能具有多个正确的解析树。

关于 LL(1) 解析的常见问题解答

1. 编译器设计中 first 和 follow 函数的必要性是什么？

答案：这两个函数帮助解析器在正确的位置应用所需的规则。

2. 列出 first 函数的一些好处？

答案

它可以用于控制应该使用哪个产生式规则来扩展 LL 或 LR 解析器中的非终结符。
它可以用来解决语法中的歧义。

下一个主题语法制导翻译

← 上一个下一个 →

我们提供所有技术（如 Java 教程、Android、Java 框架）的教程和面试问题

联系信息

G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India

hr@tpointtech.com

+91-9599086977

关注我们

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

编译器教程

基本解析

预测分析器

SDT

符号表

管理

错误检测

代码生成

代码优化

编译器设计 MCQ

预测 LL(1) 分析器

引言

预测 LL(1) 解析器的组成部分

输入缓冲区

Stack

预测解析表

解析表

解析器的运作方式

构建预测 LL1 解析器的步骤

示例 1：以具有一组产生式规则的以下语法为例

解决方案

什么是 FIRST 函数？

示例 1：考虑以下语法并计算 FIRST 函数。

解决方案

找到“A”的 first。

找到“A’”的 first。

找到“B”的 first。

找到“B’”的 first。

找到“C”的 first。

什么是 Follow 函数？

找到“A”的 follow

注意：通过使用上述方法来计算其他非终结符的 follow。

FIRST 和 FOLLOW 函数在 LL(1) 解析中的重要性

预测解析的局限性

关于 LL(1) 解析的常见问题解答

相关帖子

SLR(1) 分析

LR分析器

LALR(1) 分析

LR(0) 项

解析器生成器

CLR(1) 分析

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器