【北航编译原理笔记】2. 词法分析

原創

ETO_

2020-07-06 15:07

词法分析

功能:
根据词法规则识别及组合单词,进行词法检查
对数字常数完成数字字符串 -->二进制数值转换
删去空格字符和注释

单词种类: 保留字, 标识符, 常数, 分界符
单词内部形式: 单词类别 + 单词值
单词类别: 按单词种类分类: 标识符, 无符号常数(整), 无符号浮点数, 布尔常数, 字符串常数, 保留字, 分界符.
保留字和分界符采用一符一类

常用状态图来作词法分析
先将正则表达式转化为非确定自动机(NFA: Non-deterministic Finite Automata)(存在某一个状态,对于同一个输入有不同的结果)
再将非确定自动机转化为确定自动机(DFA: Deterministic Finite Automata)
将确定自动机简化(直到不存在等价状态): 利用一致性状和蔓延性状态不断"分区",最终还在一个分区里的状态即可以简化
画图以及程序

状态图中: 双圈表示"终止符",圈内一般是非终止符,起始圈是新加进去的.

正则文法和正则表达式的相互转化:

$A\rightarrow xB, B\rightarrow y \ \ \ \ \ \Longleftrightarrow A \rightarrow xy$ .
$A\rightarrow xA\ |\ y\ \ \ \ \ \ \ \ \ \ \ \ \ \Longleftrightarrow A \rightarrow x^*y$ .
$A\rightarrow x, A\rightarrow y\ \ \ \ \ \ \ \ \Longleftrightarrow A \rightarrow x\ |\ y$ .

对于二义性问题:

最长匹配原则, 有更长则识别更长的
优先匹配原则, 规则序列越前优先级越高, 写规则序列时要注意

NFA的确定化:
集合 $I$ 的 $\varepsilon-$ 闭包: ( $M$ 是自动机, $I$ 是 $M$ 的状态集一个子集)
若 $s \in I$ ,则 $s \in \varepsilon-Closure(I)$ .
若 $s \in I$ ,则从 $s$ 出发经过任意条 $\varepsilon$ 弧而能到达的任何状态都属于 $\varepsilon-Closure(I)$ .
$\varepsilon-Cloure(I)$ 是集合 $I$ 的 $\varepsilon-$ 闭包:
$J$ 是从 $I$ 出发,沿 $a$ 弧到达的状态所组成的集合.
$I_a = \varepsilon-Closure(J)$ .

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【北航编译原理笔记】2. 词法分析

词法分析

【北航操作系統筆記（完整版）】

【北航編譯原理筆記】4. 語義分析與符號表

【北航編譯原理筆記】2. 詞法分析

【北航計算機網絡課程筆記】2. 物理層

【北航計算機圖形學筆記】完整版

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結