文本倾向性综述

原創

2020-07-02 07:33

1. 文本倾向性分析的定义和主要任务

Peter等人指出，文本倾向性分析(Sentiment Classification)就是对用户对某个事物（如产品）的看法或评论（在BLOG社区中是以blog entry的形式出现）文本的挖掘，从而得到该看法或评论是属于对该事物的积极或消极意见。所以，文本倾向性分析(Sentiment Classification)正是解决上述问题的关键技术。

Tetsuya Nasukawa等指出：文本倾向性分析中的主要任务有以下三个：(1)找出文档中能够体现情感的词或短语；(2)判断所找出的词或短语的倾向性极性以及强度；(3)找出所抽取的词或短语与主题的关系。

2.文本倾向性分析的主要方法

主要有基于语义的以及基于机器学习的文本倾向性研究两种。

1.基于语义的文本倾向性研究方法：
a 先对待分析文本中的形容词或能够体现主观色彩的短语进行抽取，然后对抽取出来的形容词或短语逐一进行倾向性判断并赋予一个倾向值，最后将上述所有倾向值累加起来得到文章的总体文本倾向性。
b 预先建立一个倾向性语义模式库，有时还会附带一个倾向性字典。然后将待估文档参照语义模式库做模式匹配，最后累加所有匹配模式对应的倾向性值从而得到整个文档的倾向性。

有的是基于词和短语模式，有的是基于语义模式库来分析。

2.基于机器学习的传统文本分类技术
先通过人工标注一些文档的倾向性，并将这些文档作为训练集，再通过机器学习的方法构造一个褒贬两类分类器。最后使用构造好的褒贬两类分类器对待估文档进行分类，即识别出该文档的倾向性。常用SVM（支持向量机）。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

WebSocket替换Http协议的逻辑实现

· 前言 · 在國內，公網服務器與本地服務器的通信一直是個難題，本地服務器因爲IP是動態變化的，公網服務器沒辦法將請求發送給本地服務器。爲了解決這個問題，所以採用WebSocket協議替換Http協議。爲了實現請求等待，使用Gu

2024-06-03 11:25:33

spark udtf自定义函数 spark explode函数

大數據,函數相關視頻講解： 013爲什麼說未來系統是linux 008_ 輸出h字符_REPL_引號_括號_什麼是函數數據結構與算法-棧-Go代碼演示版微積分基本想法數據科學中的函數 1.如何生成多行的序列 spark sq

2024-06-01 00:06:20

重磅！Zilliz 与智源研究院联合推出自动化多样性信息检索评测基准 AIR-Bench

智源研究院聯合 Zilliz、HuggingFace、中國科技大學、中國人民大學、北京郵電大學等多家機構聯合推出專門針對檢索任務和RAG場景的評測AIR-Bench。AIR-Bench首次提出在檢索評測任務中使用LLMs生產評估數

2024-05-31 21:25:07

一键自动化博客发布工具,用过的人都说好(公众号篇)

之前收到很多朋友的要求，說是需要一個公衆號的自動發佈工具。現在，它來了。前提條件前提條件當然是先下載 blog-auto-publishing-tools這個博客自動發佈工具,地址如下：https://github.com/ddean

2024-05-24 21:38:52

一键自动化博客发布工具,用过的人都说好(知乎篇)

我們已經學習了很多自動化的知識了，接下來讓我們看看在blog-auto-publishing-tools中是如何實現自動發送博文到知乎的。前提條件前提條件當然是先下載 blog-auto-publishing-tools這個博客自動發佈

2024-05-22 21:38:51

一键自动化博客发布工具,用过的人都说好(头条篇)

雖然頭條現在非常強大，但是我還是不得不吐槽一下頭條的博客發佈，居然不支持markdown格式。並且在某些瀏覽器上還會出現編輯頁面打不開的情況，讓我一度懷疑是我瀏覽器的問題。不過，這都不重要，重要的是blog-auto-publishin

2024-05-21 21:38:49

Kmesh进入CNCF云原生全景图，实现网格治理sidecarless化

本文分享自華爲雲社區《Kmesh進入CNCF 雲原生全景圖》，作者：雲容器大未來。近日，Kmesh 正式進入 CNCF 雲原生全景圖，位於 Service Mesh 類別下。 CNCF Landscape 在雲原生實踐過程中的每個

2024-05-21 10:58:03

一键自动化博客发布工具,用过的人都说好(腾讯云篇)

之前說過blog-auto-publishing-tools的實現方式是連到現有的瀏覽器中，而不是使用內置的瀏覽器。其中一個很大程度的原因是像騰訊雲這種博客發佈平臺幾乎每天都需要重新登錄一次，登錄還需要手機掃碼。所以自動化實現起來非常複雜

2024-05-20 21:38:29

Shell/Python中的用户名获取

一、幾個基本概念登錄用戶（login user）：通過登錄方式進入系統的用戶，強調登錄身份。當前用戶（current user）：執行一個進程或者命令時所使用的用戶身份，強調執行身份。舉

2024-05-19 00:44:35

通过MVEL表达式和Apache Chain职责链模式解耦MQ消息处理节点的实践应用

導讀本文主要講解了MVEL表達式和責任鏈設計模式相結合一起的消息處理解決方案設計、解耦消息處理節點以及方便代碼維護擴展。通過“訂單拆單消息”的接入作爲具體實踐案例，簡要闡述了MVEL表達式和Apache Chain職責鏈設計模式應用場景。

2024-05-16 23:56:24

一键自动化博客发布工具,用过的人都说好(掘金篇)

終於要講解我們親愛的掘金了。掘金是一個非常不錯的平臺。所以很多朋友會把博客發佈到掘金上。發佈到掘金要填寫的內容也比較多。今天給大家介紹一下如何用blog-auto-publishing-tools這個工具自動把博客發佈到掘金平臺上去。前

2024-05-16 21:38:44

一键自动化博客发布工具,用过的人都说好(51cto篇)

51cto是一個優秀的博客平臺，今天給大家講解一下blog-auto-publishing-tools如何自動發佈博客到51cto上。當然在實現過程中有可能會遇到各種困難，不過不用擔心，我們一個個來解決。前提條件前提條件當然是先下載

2024-05-15 21:39:58

GPT-4o 引领人机交互新风向，向量数据库赛道沸腾了

OpenAI 發佈 ChatGPT-4o，意味着人機交互進入新的時代。Chat-GPT4o 是一個跨文本、視覺和音頻端到端訓練的新模型，所有輸入和輸出都由同一個神經網絡處理。這也在告訴所有人，GenAI 連接非結構化數據，非結構化數據之間跨

2024-05-15 21:25:59

每天Get一个小技巧：用DolphinScheduler实现隔几天调度

轉載自tuoluzhe8521 這篇小短文將教會你如何使用Apache DolphinScheduler實現隔幾天調度，有此需求的小夥伴學起來！ 1 場景分析 DolphinScheduler定時器模塊-定時調度時每3秒|每3分鐘|每3天這

2024-05-15 21:22:55

go-kit学习指南 - 中间件

原文：https://blog.fengjx.com/pages/d6f092 介紹 go-kit的分層設計可以看成是一個洋蔥，有許多層。這些層可以劃分爲我們的三個領域。 Service: 最內部的服務領域是基於你特定服務定義的，也是

2024-05-14 12:17:31

24小時熱門文章

最新文章

最新評論文章