「情感分析」簡單調研

情感分析領域相關內容,非正式綜述,僅供參考。

簡介

情感分析或觀點挖掘是對人們對產品、服務、組織、個人、問題、事件、話題及其屬性的觀點、情感、情緒、評價和態度的計算研究。

現有研究已經產生了可用於情感分析多項任務的大量技術,包括監督和無監督方法。在監督方法中,早期論文使用所有監督機器學習方法(如支持向量機、最大熵、樸素貝葉斯等)和特徵組合。無監督方法包括使用情感詞典、語法分析和句法模式的不同方法。現有多本綜述書籍和論文,廣泛地涵蓋了早期的方法和應用。

大約十年前,深度學習成爲強大的機器學習技術,在很多應用領域產生了當前最優的結果,包括計算機視覺、語音識別、NLP 等。近期將深度學習應用到情感分析也逐漸變得流行。

情感分析的三種粒度

  • 文檔粒度(document level):文檔級情感分類是指爲觀點型文檔標記整體的情感傾向/極性,即確定文檔整體上傳達的是積極的還是消極的觀點。因此,這是一個二元分類任務,也可以形式化爲迴歸任務,例如爲文檔按 1 到 5 星評級。一些研究者也將其看成一個五類分類任務。
  • 句子粒度(sentence level):語句級情感分類用來標定單句中的表達情感。正如之前所討論的,句子的情感可以用主觀性分類和極性分類來推斷,前者將句子分爲主觀或客觀的,而後者則判定主觀句子表示消極或積極的情感。在現有的深度學習模型中,句子情感分類通常會形成一個聯合的三類別分類問題,即預測句子爲積極、中立或消極。
  • 短語粒度(aspect level):也稱爲主題粒度,每一個短語代表了一個主題。與文檔級和語句級的情感分類不同,aspect level 情感分類同時考慮了情感信息和主題信息(情感一般都會有一個主題)。給定一個句子和主題特徵,aspect level 情感分類可以推斷出句子在主題特徵的情感極性/傾向。例如,句子「the screen is very clear but the battery life is too short.」中,如果主題特徵是「screen」,則情感是積極的,如果主題特徵是「battery life」,則情感是消極的。

深度學習模型

  1. 文檔/句子粒度:Kim等人(2013) 提出的CNN文本分類工作,成爲句子級情感分類任務的重要baseline之一;

  2. 文檔/句子粒度:基本的lstm模型加上pooling策略構成分類模型,是通常用來做情感分析的方法;

  3. 短語粒度:Tang等人(2015) 使用兩種不同的rnn網絡,結合文本和主題進行情感分析;

  4. 短語粒度:Tang等人(2016) 結合memory-network,解決target-dedependent問題,這裏的target理解爲前面提過的aspect;

  5. 短語粒度:Chen等人(2017) 分別使用位置權重記憶和層疊attention的複合機制,建模target詞和文本間的相互交互關係,以解決短語級情感分類問題;

  6. 短語粒度:Schmitt1等人(2018) 將aspect和polarity結合在一起進行分類任務訓練,得到情感分析的模型;

  7. 現在流行模型:大規模語料預訓練(詞向量/Elmo/GPT/Bert)+ 深度學習分類器(lstm/cnn/transformer),一個很好的示例見AI Challenger 2018:細粒度用戶評論情感分類冠軍思路總結

相關數據

情感詞典

情感數據集

其他資源

文獻資料

我的公衆號:「海龍的學習圈子」,我是一位研究生,自然語言處理愛好者,參加nlp競賽獎金收入30w+,實習收入20w+
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章