論文列表——stance detection

這學期做了一些和stance detection相關的工作,stance detection,可理解爲“立場檢測”,stance即爲人對個體、事物、事件所表現出的看法或者態度,如“支持、反對”。stance detection雖然也屬於文本分類,但和基於主題的文本分類、情感分類有些差異,stance的表達是更隱晦的,因此分類難度更大。在此列出自己閱讀論文的列表,部分論文直接列出一些簡單的筆記,這些論文可讀性不強(方法過於簡單,或者論文本身的貢獻不在方法上,沒有太多記錄成筆記的價值…),部分論文會逐步完善,給出簡單的閱讀筆記。閱讀價值評分純粹是基於自己對於文章的理解,標準包括:動機、方法、數據集質量、實驗安排、相關工作等,滿分爲5(相對評分,即分值高低僅反映論文在以下列表中的可讀價值,並不一定說明這篇文章有多好)。列表如下:

名稱 所屬會議(來源) 類型 時間 閱讀價值 筆記
Modeling Stance in Student Essays ACL long paper 2016 1 自己構建的student essay數據集,包含800多篇,6分類;構建了很多特徵,其中path-based features可以看看。實驗效果比前人的基於feature set的模型要好一點。
Hawkes Processes for Continuous Time Sequence Classification: an Application to Rumour Stance Classification in Twitter ACL short paper 2016 1 較早的一篇文章,稍微看看就好。裏面將Twitter轉化爲時序,進而用統計學模型進行求解的轉化思路值得借鑑。
A Multidimensional Lexicon for Interpersonal Stancetaking Umashanthi ACL long paper 2017 1
Cross-Target Stance Classification with Self-Attention Networks ACL short paper 2018 3.5 在具有相似預測目標的不同態度分類數據集上進行遷移學習。將模型從數據集A中學習到的關於target的知識運用到數據集B的目標預測上。劃重點,遷移學習。
Weakly-Guided User Stance Prediction via Joint Modeling of Content and Social Interaction CIKM long paper 2017 2.5 無監督的stance prediction。自己爬取的CNN news和4Forums;由於數據是跟debate forum相關的,因此每條post都有有十分豐富的上下文,並且上下文不同post之間會產生關係(支持、反駁等)。模型先根據一系列的上下文和不同post之間的關係,得出不同立場的詞表,再得出用戶在該topic下的stance極性打分。模型的具體方法沒有細看,運用了一些啓發式規則和限制條件下的最優化方法。本文的問題是圍繞debate forum展開,數據集具有一定的特性,不同用戶的相互支持、反駁使得能夠無監督地聚類不同態度的詞彙表達。這和之前接觸的stance detection任務不太相同。
A Temporal Attentional Model for Rumor Stance Classification CIKM short paper 2017 4 TO BE CONTINUED
A Joint Sentiment-Target-Stance Model for Stance Classification in Tweets COLING long paper 2016 2.5 SemEval 2016 task 6;前人工作在建模stance時,會將target和sentiment作爲額外特徵。而本文針對stance、target、sentiment聯合建模。使用了概率圖模型,反覆看了幾遍沒看懂,暫時放棄。。。聯合建模sentiment、target、stance,思路很好,但是方法上不太理解。或許將target、sentiment作爲輔助信息加入NN,或者利用網絡結構進行聯合建模能更好地捕捉信息?
UTCNN: a Deep Learning Model of Stance Classificationon on Social Media Text COLING long paper 2016 3.5 TO BE CONTINUED
Stance Classification in Rumours as a Sequential Task Exploiting the Tree Structure of Social Media Conversations COLING long paper 2017 3.5 TO BE CONTINUED
Scrutable Feature Sets for Stance Classificatio COLING wordshop 2016 1
Structured Representation Learning for Online Debate Stance Prediction COLING long paper 2018 2 online debate stance prediction。4FORUMS,CREATEDEBATE的數據;文章將debate forum中的各類信息進行embedding,通過text embedding的相似性來找已知stance和待預測stance的embedding相似性。文中還針對一些依賴關係添加了限制條件。和另一篇CIKM2017的文章一樣,都是討論的debate forum的stance detection。不過跟目前要做的問題有差別。
Stance Detection with Hierarchical Attention Network COLING long paper 2018 4 TO BE CONTINUED
Predicting Stances from Social Media Posts using Factorization Machines COLING long paper 2018 2 stance detection on silent user。自己爬取的Twitter日語數據;使用FM進行建模,利用了四部分信息作爲特徵:用戶信息、topic信息、用戶在其它topic上的stance、用戶的posts。實驗部分只進行了各部分特徵的實驗,以及多數投票的baseline。角度新穎,但文章集裏幾乎沒人做,數據也是用的自己的爬的。如果之後用FM的話可以回過頭來看。
Can Rumour Stance Alone Predict Veracity? COLING long paper 2018 1
A Retrospective Analysis of the Fake News Challenge Stance Detection Task COLING 2018 long paper 4.5 TO BE CONTINUED
A Dataset for Multi-Target Stance Classification EACL long paper 2017 3 這篇文章主要是提出了一個數據集,但這個問題和正在做的AIC、DF是類似的,即一個樣本中含有多個target,需要預測對於不同target的態度(情感)。本篇文章也提出了一個框架,利用seq2seq,decoder端利用target1的label作爲target2的預測輸入一部分。這種方法假定了target之間是有關聯的,比如針對兩位選舉候選人的看法,因此數據集構建中也是每條數據包含了兩個target。這樣還是把問題做的太細了,假設也太強,距離AIC、DF的實際問題還很遠。
Stance Classification of Context-Dependent Claims NAACL long paper 2016 2.5 一篇比較水的文章,paper2paper的工作,在IBM之前構建的claim數據集上進行stance的檢測。分爲三步:1、識別給定topic和claim的目標;2、識別對應目標的情感;3、確定針對目標的表意是否一致。三部分的模型都用的傳統方法,包括句法樹、情感詞、條件概率等。
Topical Stance Detection for Twitter: A Two-Phase LSTM Model Using Attention ECIR journal 2018 4 TO BE CONTINUED
Stance Detection with Bidirectional Conditional Encoding EMNLP long paper 2016 4.5 TO BE CONTINUED
ConStance: Modeling Annotation Contexts to Improve Stance Classification EMNLP long paper 2017 1
From Clickbait to Fake News Detection: An Approach based on Detecting the Stance of Headlines to Articles EMNLP short paper 2017 2.5 FNC-1;兩階段方法,先使用基於詞形還原的n-gram來對headline和body的匹配度打分(自定義的公式),二分類爲是否相關,若相關則使用LR繼續判定細分的類別。這是FNC-1的9th的解法,很簡單。足以反映基於詞頻、只依賴詞頻的模型已經能很好地解決這一問題。9th的得分爲9270,1st爲9556,並不需要神經網絡。
Fake News Detection using Stacked Ensemble of Classifiers EMNLP workshop 2017 1
Stance classification with target-specific neural attention networks IJCAI long paper 2017 4.5 TO BE CONTINUED
Integrating Stance Detection and Fact Checking in a Unified Corpus NAACL short paper 2018 1
360 Stance Detection NAACL shrot paper 2018 2 自己爬的數據集;本文主要實現了一個web工具,用戶輸入一個query(topic),工具自動展示各大消息網站關於該topic的相關內容,以及標註的stance。
Automatic Stance Detection Using End-to-End Memory Networks NAACL long paper 2018 4.5 TO BE CONTINUED
Overview of NLPCC Shared Task 4: Stance Detection in Chinese Microblogs NLPCC 2016 3.5 NLPCC 2016 shared task 4 的官方總結文章。主辦方以新浪微博爲數據源,採集了5個target共3000條數據做訓練集(subtask A),數據是由學生標的。top-1選手使用的是手工特徵+SVM/RF,其他也大多使用的是手工特徵。在文章集中很少看到使用這個數據集的,方法不具有太大的創新價值,都發表在了NLPCC上,方法也多爲傳統方法。文章前面關於stance detection的任務定義、與情感分析的區別總結的很好,值得一看。以後如果要使用該數據集並進行結果對比時,再回來索引相關參賽隊伍的文章。
Multi-Target Stance Detection via a Dynamic Memory-Augmented Network SIGIR short paper 2018 4 TO BE CONTINUED
SemEval-2016 Task 6: Detecting Stance in Tweets SemEval 2016 5 TO BE CONTINUED
SemEval-2017 Task 8: RumourEval: Determining rumour veracity and support for rumours SemEval 2017 5 TO BE CONTINUED
Detect Rumor and Stance Jointly by Neural Multi-task Learning WWW long paper 2018 4 TO BE CONTINUED
Ranking-based Method for News Stance Detection WWW short paper 2018 3.5 TO BE CONTINUED
Combining Neural, Statistical and External Features for Fake News Stance Identification WWW long paper 2018 4 TO BE CONTINUED
Detect Rumor and Stance Jointly by Neural Multi-task Learning WWW workshop 2018 4 FNC-1;三路神經網絡分別編碼:詞向量特徵、TF特徵、外部特徵。其中使用了skip-thought embedding,說可以衡量句子相似度。之後要去看一下。然後模型結構很普適,神經網絡分別建模各部分特徵,再由另一個神經網絡來組合特徵表示。
Detection and Resolution of Rumours in Social Media: A Survey ACM Computing Surveys journal 2018 5 Survey
Combining Similarity Features and Deep Representation Learning for Stance Detection in the Context of Checking Fake News ACM Journal of Data and Information Quality journal 2018 5 TO BE CONTINUED

縮寫解釋:

  • AIC:AI Challenger
  • DF:Data Fountain
  • FNC-1:Fake News Challenge — 1st period

TO BE CONTINUED 標註的論文,會在後面單開博文來詳細講。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章