CFG文法及左遞歸的消除——編譯原理

原創

饭泡开水

2020-06-16 14:41

爲了寫實驗，重新回顧一下CFG和左遞歸

文章目錄

1、上下文無關文法

（1） 上下文無關文法（CFG，Context Free Grammar）

顧名思義就是與上下文無關，不考慮上下文的語境，可以將它單獨拿出進行分析、解釋。

（2）上下文無關文法包含的四個部分：

一組非終結符（V_N）、一組終結符號（V_T）、一組產生式（P）、一個開始符號（S）。

例：G1=（V_N，V_T，P，S）
其中：V_N={E}，V_T={i，+，*}，S=E，P={E->i，E->E+E，E->E*E}

如果產生式有共同的左部，如 $\alpha$ -> $\beta$ ， $\alpha$ -> $\gamma$ ，可簡寫爲 $\alpha$ -> $\beta$ | $\gamma$ ，其中 $\beta$ ， $\gamma$ 分別稱爲 $\alpha$ 的一個候選式

將上面的產生式寫成E->i|E+E|E*E的形式，最後可轉換爲E->i+i|i*i

終結符（Terminator）：是組成語言的基本符號。顧名思義就是到了結尾的符號，是不可再分的具有獨立意義的基本符號。（emm，說白了就是不能繼續進行替換的符號，如例中最後的形式，i即爲終結符）

非終結符（Nonterminal）：用來表示語法範疇，如表達式、函數。（還可以繼續進行替換的符號，如最後的E->i+i，可以用E表示加法和乘法）

產生式（production）：所謂產生式是定義語法範疇的一種書寫規則。也被稱爲重寫規則，可以用一個符號串替換另一個符號串。（如E->i，E->E+E；E可以用i和E+E進行替換）

開始符號（start）：特別的非終結符，代表所定義的語言中的最終的語法範疇。

（3）上下文無關文法的定義

文法G是一個四元組，G=（V_N，V_T，P，S），其中V_N，V_T分別是非空有限的非終結符號集合終結符號集，V_N $\bigcap$ V_T = $\emptyset$ ，P是產生式集，S $\in$ V_N稱爲文法的識別符號或開始符號。開始符號S必須在某個產生式的左部出現一次。

2、遞歸

（1）遞歸產生式:

形如：
A->xAy， x,y $\in$ (V_T $\bigcup$ V_N)^*,A $\in$ V~N
的產生式稱爲遞歸產生式

（2）左遞歸產生式

直接左遞歸

在遞歸產生式的基礎上，若x = $\varepsilon$ （即候選式的第一個字符與開始符號相同，進行替換時，右邊確定爲y，左邊則是一個A的遞歸），有
A->Ay
這個稱爲直接遞歸產生式

間接左遞歸

間接左遞歸：每一條產生式都不是直接左遞歸，但經過多次推導可以得出直接左遞歸，則爲間接左遞歸
例：
A->Bb
B->A|a
替換後：A->Ab|ab

（3）右遞歸產生式

直接右遞歸

在遞歸產生式的基礎上，若y = $\varepsilon$ （即候選式的最後一個字符與開始符號相同，進行替換時，左邊確定爲x，右邊則是一個A的遞歸），有
A->xA
這個稱爲直接右遞歸產生式

間接右遞歸

3、消除直接左遞歸

（1）方法
直接改寫法

U -> Ux | y
U -> yU’
U’ -> xU’ | $\varepsilon$

（2）例

A -> [B
B -> X] | BA
X -> Xa|Xb|a|b

消除後結果

A -> [B
B -> X]B’
B’ -> AB’ | $\varepsilon$
X -> aX’ | bX’
X’ -> aX’ | bX’ | $\varepsilon$

4、消除間接左遞歸

（1）方法

1、將文法G的所有非終結符整理成某一順序U₁，U₂…，U_n
2、開始符號從後往前走

for（ i : 1 到 n）

for（j : 1 到 i - 1）

將產生式U_i -> U_jα₁ | U_jα₂…替換爲
Ui -> β₁α₁ | β₁α₂ | β₂α₁ | β₂α₂ | … | β_mα₂
（其中U_j -> β₁ | β₂ | … | β_m）

（2）例

A -> Bcd
B -> Ce | f
C -> Ab | c

分析：

開始符號爲A、B；從後往前，故U₁ = C，U₂ = B，U₃=A
i = 2，j = 1時：

U₂ -> U₁α
將B -> Ce | f 替換爲 B -> Abe | ce | f
U₁爲C，α₁爲Ab，α₂爲c；含有開始符號除去後爲α
U₂爲B，β₁爲Ce，β₂爲f； Uj的候選式即爲β
將α與β組合再加上不含U1的部分（f），即Abe | ce | f

B -> Abe | ce | f
i = 3，j = 2

U₃ -> U₂α
將A -> Bcd 替換爲 A -> Abecd | cecd | fcd
U₃爲A，α爲Bcd；
U₂爲B，β₁爲Abe，β₂爲ce，β₂爲f；
將α與β組合，即Abecd | cecd | fcd

消除後結果

A -> Abecd | cecd | fcd

5、代碼實現

[編譯原理-左遞歸的消除-QT/C++]（）

6、結

emm，還好對這個內容重新看了一下，不然都沒有發現我代碼中的邏輯錯誤

文中有一些知識的解釋是自己理解的，不一定對，學藝不精-_-||

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

CFG文法及左遞歸的消除——編譯原理

文章目錄

1、上下文無關文法

2、遞歸

3、消除直接左遞歸

4、消除間接左遞歸

5、代碼實現

6、結

如何使用 JS 判斷用戶是否處於活躍狀態

Mono 支持LoongArch架構

lightdb秒級增加列和刪除列（not null帶默認值）

lightdb數據庫超時相關控制參數

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

網絡爬蟲的祕密：如何高效地抓取JD.com視頻鏈接

lightdb mysql 8.0兼容之不可見主鍵

使用 JS 實現在瀏覽器控制檯打印圖片 console.image()

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（四）使用域名訪問網站應用

文法左遞歸的消除（QT/C++）—— 編譯原理

QT創建兩個窗口實現返回功能

計算機科學與技術專業學點啥

將NetBeans下的web項目轉到eclipse中

python筆記2(函數)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結