自然語言處理（四）——下推自動機接受的語言

原創

2020-07-07 03:14

一、概念

下推自動機的定義：一個不確定的PDA可以表達成一個7元組： M = (Σ, Q, Γ, δ, q0, Z0, F) 其中，Σ 是輸入符號的有窮集合； Q 是狀態的有限集合； q0 ∈ Q 是初始狀態； Γ 爲下推存儲器符號的有窮集合； Z0∈Γ 爲最初出現在下推存儲器頂端的開始符號; F 是終止狀態集合，F ⊆ Q； δ 是從 Q×(Σ∪{ε})×Γ 到 Q×Γ* 的子集的映射。

映射關係 δ(q, a, Z) = {(q1, γ1), (q2, γ2), …, (qm, γm)} 其中, q1, q2, …, qm∈Q, a∈Σ, Z∈Γ, γ1, γ2,…,γm∈Γ*。該映射的意思是：當PDA處於狀態 q，面臨輸入符號 a時，自動機將進入到 qi, i = 1, 2, …, m 狀態，並以 γi 來代替下推存儲器（棧）頂端符號Z，同時將輸入頭指向下一個字符。當 Z 被 γi 取代時，γi 的符號按照從左到右的順序依次從下向上推入到存儲器。

特殊情況下，δ(q, ε, Z)={(q1, γ1), (q2, γ2), …, (qm, γm)} 時，輸入頭位置不移動，只用於處理下推存儲器內部的操作，叫作 “ε移動”。

這些定義我看得快炸了，沒理解這是什麼意思。下面是一個圖，可能比較直觀的顯示出，下推自動機與有限自動機的區別就是多出一個下推存儲器。

以上的定義都是教材的內容，如果光看理論，我反正是一頭霧水，不知所云。不過結合一個例子可能會有所理解。下面的例子是判斷一個句子是否能夠被下推自動機所接受。

二、下推自動機接受的語言

下推自動機 M 所接受的語言定義爲： T(M) = {x|x: (q0, Z0) (q, M γ), γ ∈Γ*, q ∈F }。下面通過這個例子來走一遍過程。看着下面這些符號實在是頭大，不過通過具體的例子分析也不難理解。

對於輸入 abbcbba 這個句子。下推自動機是怎麼樣判斷這個句子是否合法呢？它的處理步驟如下：

（一）、#是開始符號，0是初始狀態。首先從輸入帶的第一個字符讀入。輸入了a，根據規則 1。將A壓入棧。狀態仍然爲0；

（二）、狀態爲0，輸入b。根據規則 2。將B壓入棧，狀態仍然爲0.

（三）、狀態爲0，輸入b。根據規則 2。將B壓入棧，狀態仍然爲0.

（四）、狀態爲0，輸入c。根據規則 3。將ε（空串）壓入棧中，也就是什麼都不做，狀態變爲1.

（五）、狀態爲1，輸入b。根據規則 5。將B彈出棧，狀態仍然爲1.

（六）、狀態爲1，輸入b。根據規則 5。將B彈出棧，狀態仍然爲1.

（七）、狀態爲1，輸入b。根據規則 4。將A彈出棧，狀態仍然爲1。

到此爲止，所有的字符讀取完畢，此時檢查到棧裏面也只有開始字符，狀態爲1（中止狀態）。因此abbcbba被此下推自動機所接受。

最後，我這裏面所用到的語言可能不準確，但都是爲了便於自己理解，，算法的實現過程可能有錯誤，如果各位看到有什麼錯誤遺漏不當之處，還望不吝賜教，拜謝。

參考資料有：宗成慶的《統計自然語言處理》

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

大模型安全｜RAG精確應對大模型敏感問題知識幻覺難題

一、引言在大模型的實際應用落地過程中，會遇到所謂的幻覺（Hallucination）問題。對於語言模型而言，當生成的文本語法正確流暢，但與原文不符（Faithfulness）或事實不符（Factualness）時，模型便出現了幻覺的問題。

2024-06-07 21:41:51

技術實踐 | RAG精確應對大模型敏感問題知識幻覺難題

一、引言在大模型的實際應用落地過程中，會遇到所謂的幻覺（Hallucination）問題。對於語言模型而言，當生成的文本語法正確流暢，但與原文不符（Faithfulness）或事實不符（Factualness）時，模型便出現

2024-06-07 21:41:50

大模型在推薦系統中的精準推薦策略與實踐

引言推薦系統在現代互聯網應用中佔據了極其重要的位置。無論是電商平臺、社交媒體、音樂和視頻流媒體服務，還是新聞和內容推薦系統，推薦系統都在提高用戶體驗和平臺收益方面發揮着關鍵作用。近年來，隨着人工智能和機器學習技術的迅猛發展，大模型（如G

2024-06-06 23:55:10

華爲雲大咖說：開發者應用AI大模型的“道、法、術”

本文分享自華爲雲社區《華爲大咖說 | 企業應用AI大模型的“道、法、術” ——道：認知篇》，作者：華爲雲PaaS服務小智。本期核心觀點上車：AGI是未來5～10年內，每個人都無法迴避的技術革命，建議就近上車。迭代：眼下的AI大模型應

2024-05-30 10:58:22

怎麼使用Stable diffusion中的models

Stable diffusion中的models Stable diffusion model也可以叫做checkpoint model，是預先訓練好的Stable diffusion權重，用於生成特定風格的圖像。模型生成的圖像類型取決於訓

2024-05-28 21:38:55

【終極指南】使用Python可視化分析文本情感傾向

本文分享自華爲雲社區《Python理解文本情感傾向的終極指南》，作者：檸檬味擁抱。情感分析是一種通過自然語言處理技術來識別、提取和量化文本中的情感傾向的方法。Python在這一領域有着豐富的庫和工具，如NLTK、TextBlob和VAD

2024-05-28 10:58:03

解讀注意力機制原理，教你使用Python實現深度學習模型

本文分享自華爲雲社區《使用Python實現深度學習模型：注意力機制（Attention）》，作者：Echo_Wish。在深度學習的世界裏，注意力機制（Attention Mechanism）是一種強大的技術，被廣泛應用於自然語言處理（NL

2024-05-27 10:58:44

智能測試持續加碼，大模型引領軟件測試新生態

在軟件行業日新月異的今天，智能測試已成爲提升軟件質量的關鍵環節。大模型的崛起，更是爲軟件測試帶來了前所未有的變革。隨着AI和ML技術的突飛猛進，智能測試得到了快速發展，實現了對測試過程的自動化和智能化管理，顯著提高了測試效率和質量。如今，智

2024-05-25 02:07:17

文心大模型免費辣，動手搓點啥慶祝一下吧

5月21日下午，百度智能雲宣佈文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費，即刻生效。這兩款大模型都是今年3月剛剛發佈的，均支持8K和128k上下文長度。可以說，這是百度最新的模型

2024-05-24 12:13:22

我宣佈，這是我找到的史上AI最全論文體系！

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。搞AI，不少人都進入一個誤區，那就是隻鑽研自己的代碼是否精進，而沒有注意提升自己的閱讀能力。實際上，一個專業的學術研究員或者AI研究員可能需要花費幾百個小

2024-05-13 21:33:50

攻擊者正在利用AI，對保險公司發起大規模欺詐

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

LoRA微調語言大模型的實用技巧與實踐

隨着人工智能技術的不斷髮展，大型語言模型在各個領域的應用越來越廣泛。然而，大型語言模型的訓練成本高昂，且難以適應不同領域的具體需求。爲了解決這個問題，LoRA微調技術應運而生。本文將介紹LoRA微調語言大模型的實用技巧，幫助讀者更好地應用這

2024-05-09 12:48:45

大模型微調方法總結：LoRA, Adapter, Prefix-tuning, P-tuning, Prompt-tuning

隨着自然語言處理（NLP）技術的不斷髮展，大模型微調（finetune）方法成爲了提高模型性能的關鍵手段。本文將對LoRA、Adapter、Prefix-tuning、P-tuning和Prompt-tuning等主流微調方法進行總結，幫助

2024-05-09 12:48:44

GLM國產大模型訓練加速：高效性能與成本優化的實踐

隨着人工智能技術的不斷進步，大模型的訓練成爲了推動深度學習領域發展的重要力量。然而，傳統的訓練方式往往面臨着性能瓶頸和高昂的成本問題，這使得許多研究者和開發者望而卻步。爲了解決這一難題，我們探索了使用OneFlow框架對GLM國產大模型進行

2024-05-07 23:30:09

大模型微調提升AI應用性能

隨着人工智能技術的不斷髮展和普及，越來越多的領域開始應用AI技術來解決實際問題。其中，大模型作爲一種重要的技術手段，得到了廣泛的應用。然而，如何提高大模型的性能，使其更好地適應各種應用場景，一直是業界關注的焦點。本文將介紹一種有效的技術手段

2024-04-28 11:30:14

24小時熱門文章

最新文章

最新評論文章