- 首先對文本進行分詞,因爲可以直接用NLTK的分詞器,中文的可以用結巴分詞
- 在英文中,往往還需要對單詞進行詞幹提取和詞形歸一化。在詞形歸一的過程中如果結合POS Tag可以更好的進行詞形歸一。
- 去除停用詞,得到最終的詞列表
本文轉自:https://blog.csdn.net/yc1203968305/article/details/79062182
本文轉自:https://blog.csdn.net/yc1203968305/article/details/79062182
一、任務介紹 本任務是NLP&CC 2013的跨語言情感分析,主要是在英文資源的前提下,對測試集內的每條中文評論進行傾向性分類。 本任務的所有數據均由主辦方提供,主要包含三部分: ① 英文