使用有限狀態機(FSM)解釋shell 命令

一、有限狀態機(Finite State Machine,FSM)是表示有限個狀態及在這些狀態之間的轉移和動作等行爲的數學模型,在計算機領域有着廣泛的應用。FSM一個常見的應用就是用來負責Parser複雜的數據結構,比如解釋URI協議(uri-rfc239、uri-rfc3986)(註釋:統一資源標識符(Uniform Resource Identifier,或URI)),在這裏以Linux下shell命令字符串解釋爲列子,說明FSM的應用。

二、簡單介紹shell中的各種符號應用
1、shell腳本中的單引號和雙引號一樣都是字符串的界定符,而不是字符的界定符。單引號用於保持引號內所有字符的字面值,即使引號內的\和回車也不例外,但是字符串中不能出現單引號。(注意是所有,只是單引號本身不能夠出現在其中)。

2、雙引號用於保持引號內所有字符的字面值(回車也不例外),但以下情況除外:
escape$ 的字面值
`表示`的字面值
\”表示”的字面值
\表示\的字面值
除以上情況之外,在其它字符前面的\無特殊含義,只表示字面值。

雙引號還有一個作用,引用的字符串包含空格的時候,可以用雙引號括起來。

3、環境變量,使用() USER, HOME使 {USER},${HOME}形式引用環境變量。

三、基於以上認識,設計了下面的狀態圖,系統初始狀態是TEXT狀態,其中ESC是ESCAPE,表示轉義字符狀態,舉個列子,提供shell字符串cmdline,逐個每個輸入的字符,如果遇到輸入進來的字符是 \ 表示進入ESC狀態,在ESC狀態輸入任何字符立即進入TEXT狀態。在看,TEXT狀態,如果輸入的字符是$,系統進入VAR環境變量狀態,再接下來如果是 { 字符, 系統進入 VARNAME2 狀態,否則進入 VARNAME狀態。待系統遍歷完所有的cmdline上的字符,就完成了shell 命令的解釋(parser)工作。

這裏寫圖片描述

四、上代碼

這裏寫代碼片
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章