馬爾科夫的詞性分析三部曲

原創

2018-09-03 09:33

在自然語言處理（NLP）領域，單詞除了其本身的含義可以用來傳遞信息外，單詞的詞性屬性也包含也包含了非常重要的信息。根據單詞的詞性，人們可以對文本的單詞進行過濾篩選，以篩選掉那些信息含量較少的單詞，從而提升處理的文本質量。而如何從文本中有效地甄別每個單詞的詞性並非是一個簡單的問題，原因在於中文單詞很多是多詞性的，而實際人眼去識別單詞詞性往往是根據單詞的上下文來判斷的。但是，如何讓機器也像人一樣能夠根據上下文去判斷詞性呢？

爲此，本文將介紹一種經典的詞性分析方法來完成此項任務，即隱馬爾科夫的詞性分析方法。與現有的完整的隱馬爾科夫詞性方法不同，考慮到完整的隱馬爾科夫方法需要擁有較爲昂貴的數據資源，本文將從馬爾科夫的理論基礎出發介紹三種基於馬爾科夫鏈的詞性分析方法。這三種方法所考慮的問題一個比一個複雜，同時所需要的數據資源也越來越多。如此一來，就可以保證再各個資源條件下均可完成詞性分析任務。當然了，越複雜的方法效果越好。

更重要的是，通過本文的介紹可以更好地瞭解隱馬爾科夫理論的發展歷程。也許隱馬爾科夫方法本身很難，但一步步剖析下來也許就沒那麼難了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

An Overview of Reinforcement Learning

強化學習概覽 This overview is largely based on this article: https://medium.com/@SmartLabAI/reinforcement-learning-algorithms

2020-07-08 12:16:49

HDU-1205(喫糖果)

喫糖果 Time Limit: 6000/3000 MS (Java/Others) Memory Limit: 65535/32768 K (Java/Others) Total Submission(s): 32022

2020-07-08 12:17:52

算法系列01----插入排序

插入排序法 1.工作原理（算法思路）新建一個指針，指針左邊的所有元素都是有序的。但是他們的位置並不是最終位置，一個指針從左向右掃描，若指針所在處的元素比左邊元素小，則將該元素向前浮動至適當位置，使指針左側元素仍然保持有序。當指針掃描到整

2022-07-27 13:26:21

算法設計與分析【0】要點

2020-07-08 12:35:25

算法設計與分析【2】分治算法

分治基本思想影響算法複雜度的因素經典案例1 二分檢索設計思想僞碼2 二分歸併設計思想僞碼3 漢諾塔設計思想僞碼4 快速排序設計思想僞碼實例5 快速傅里葉變換（信號平滑處理）問題描述設計&分析減少子問題個數案例：大數相乘設計思想參考

2020-07-08 12:35:24

XGBoost探索

XGBoost可以用來分類，迴歸，排序。支持多種語言：C++, Python, R, Java, Scala, Julia。安裝參考https://xgboost.readthedocs.io/en/latest/buil

2020-07-08 12:17:40

常用的評測指標

NDCG（Normalized Discounted Cumulative Gain）: 維基百科寫的很清楚。注意理解這四個詞。 Discounted：順序影響指標。 Normalized：消除文檔個數對指標的影響。

2020-07-08 12:17:29

推薦系統系列：商品關聯分析

商品關聯分析關聯 relevance: 主要用在互聯網的內容和文檔上，比如搜索引擎算法文檔中之間的關聯性。 association: 用在實際的事物之上，比如電子商務網站上的商品之間的關聯度。支持度（support）：數據集中

2020-07-08 12:17:28

[NOTE in progress] Simulation Optimization

簡單記錄一下關於仿真優化的一些知識點和思考。主要基於：Handbook of Simulation Optimization, Michael Fu Table of Contents Overview Discrete Optimiza

2020-07-08 12:17:01

A Road Map for Deep Learning

點這個： https://towardsdatascience.com/a-road-map-for-deep-learning-b9aee0b2919f

2020-07-08 12:17:01

Stochastic Optimization: Casual Notes

Currently learning stochastic optimization (SO) theory, I will note important content here. Some book references ar

2020-07-08 12:17:01

[NOTE in progress] Distributed Optimization and Statistical Learning via ADMM - Boyd

Reading notes of the paper "Distributed Optimization and Statistical Learning via ADMM" by Boyd, Parikh, Chu, Peleato a

2020-07-08 12:16:50

[NOTE in progress] ECE236C - Optimization Methods for Large-Scale Systems [on going]

Source:http://www.seas.ucla.edu/~vandenbe/ee236c.html Introduction Outline First-order algorithms Decomposition and s

2020-07-08 12:16:49

【轉載】Overview of gradient descent algorithms

Overview of gradient descent algorithms An overview of gradient descent optimization algorithms Gradient descent is

2020-07-08 12:16:49

leetcode-112-路徑總和

function TreeNode(val) { this.val = val; this.left = this.right = null; } 解一：遞歸先判斷樹結構是否爲null，如果是null，直接

2020-07-08 12:04:52

24小時熱門文章

最新文章

最新評論文章