API 速查¶

ANTLR API 文档¶

ANTLR 提供了一套面向对象的 API，用于构建和使用由 ANTLR 生成的词法分析器。

ANTLR 的官方文档可以点击这里，完整的 API 文档可以在这里找到。下面简单介绍实验涉及到的一些核心类和接口，方便同学们在编写代码时查阅。

Lexer 类是所有由 ANTLR 生成的词法分析器的基类。它负责将输入的字符流（CharStream）转换成一个个的词法单元（Token）。

主要方法和描述：

Token 类表示由词法分析器生成的一个词法单元，其中包含了关于该词法单元的所有信息，如类型、文本和在输入文本中的位置。

主要方法和描述：

Vocabulary 类保存了词法分析器使用的词法符号的名称，并提供了一系列方法来访问，这对于打印调试信息或者在解析时生成更可读的输出非常有用。

主要方法：

getSymbolicName(int tokenType)：根据词法单元的类型（tokenType）返回其符号名称，也即在 .g4 文件中定义的规则名。
getLiteralName(int tokenType)：根据词法单元的类型返回其字面值名称（如果有的话）。
getDisplayName(int tokenType)：根据词法单元的类型返回最适合显示的名称。

在使用 flex 构建词法分析器时，同学主要会与 flex 的宏定义、函数和配置选项打交道。flex 是一个为了快速生成词法分析器的工具，它不像 ANTLR 那样有一个面向对象的 API 集合，而是基于一系列的宏定义和函数来工作。

Github 上有 flex 的完整文档，下面简单介绍一些在使用 flex 构建词法分析器过程中，最可能用到的关键概念和组件：

一条规则由一个模式和随后的 C 代码块组成，基本结构为 模式 { ... }。模式可以使用正则表达式来定义，模式匹配后执行后面的代码块。

一些特殊正则表达式符号的含义如下：

快来问问agent吧！

我是YatCC文档AI助手，可以问我有关文档的一切！