「情感分析」簡單調研

原創

2019-03-10 03:00

情感分析領域相關內容，非正式綜述，僅供參考。

簡介

情感分析或觀點挖掘是對人們對產品、服務、組織、個人、問題、事件、話題及其屬性的觀點、情感、情緒、評價和態度的計算研究。

現有研究已經產生了可用於情感分析多項任務的大量技術，包括監督和無監督方法。在監督方法中，早期論文使用所有監督機器學習方法（如支持向量機、最大熵、樸素貝葉斯等）和特徵組合。無監督方法包括使用情感詞典、語法分析和句法模式的不同方法。現有多本綜述書籍和論文，廣泛地涵蓋了早期的方法和應用。

大約十年前，深度學習成爲強大的機器學習技術，在很多應用領域產生了當前最優的結果，包括計算機視覺、語音識別、NLP 等。近期將深度學習應用到情感分析也逐漸變得流行。

情感分析的三種粒度

文檔粒度（document level）：文檔級情感分類是指爲觀點型文檔標記整體的情感傾向／極性，即確定文檔整體上傳達的是積極的還是消極的觀點。因此，這是一個二元分類任務，也可以形式化爲迴歸任務，例如爲文檔按 1 到 5 星評級。一些研究者也將其看成一個五類分類任務。
句子粒度（sentence level）：語句級情感分類用來標定單句中的表達情感。正如之前所討論的，句子的情感可以用主觀性分類和極性分類來推斷，前者將句子分爲主觀或客觀的，而後者則判定主觀句子表示消極或積極的情感。在現有的深度學習模型中，句子情感分類通常會形成一個聯合的三類別分類問題，即預測句子爲積極、中立或消極。
短語粒度（aspect level）：也稱爲主題粒度，每一個短語代表了一個主題。與文檔級和語句級的情感分類不同，aspect level 情感分類同時考慮了情感信息和主題信息（情感一般都會有一個主題）。給定一個句子和主題特徵，aspect level 情感分類可以推斷出句子在主題特徵的情感極性／傾向。例如，句子「the screen is very clear but the battery life is too short.」中，如果主題特徵是「screen」，則情感是積極的，如果主題特徵是「battery life」，則情感是消極的。

文檔/句子粒度：Kim等人（2013）提出的CNN文本分類工作，成爲句子級情感分類任務的重要baseline之一；
文檔/句子粒度：基本的lstm模型加上pooling策略構成分類模型，是通常用來做情感分析的方法；
短語粒度：Tang等人（2015）使用兩種不同的rnn網絡，結合文本和主題進行情感分析；
短語粒度：Tang等人（2016）結合memory-network，解決target-dedependent問題，這裏的target理解爲前面提過的aspect；
短語粒度：Chen等人（2017）分別使用位置權重記憶和層疊attention的複合機制，建模target詞和文本間的相互交互關係，以解決短語級情感分類問題；
短語粒度：Schmitt1等人（2018）將aspect和polarity結合在一起進行分類任務訓練，得到情感分析的模型；
現在流行模型：大規模語料預訓練（詞向量/Elmo/GPT/Bert）+ 深度學習分類器（lstm/cnn/transformer），一個很好的示例見AI Challenger 2018：細粒度用戶評論情感分類冠軍思路總結。

文本情感分析綜述（騰訊語義團隊）
Deep learning for sentiment analysis: A survey
情感分析資源大全
Tang D, Qin B, Liu T. Aspect level sentiment classification with deep memory network[J]. arXiv preprint arXiv:1605.08900, 2016.
Kim Y. Convolutional neural networks for sentence classification[J]. arXiv preprint arXiv:1408.5882, 2014.

我的公衆號：「海龍的學習圈子」，我是一位研究生，自然語言處理愛好者，參加nlp競賽獎金收入30w+，實習收入20w+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.