這學期做了一些和stance detection相關的工作,stance detection,可理解爲“立場檢測”,stance即爲人對個體、事物、事件所表現出的看法或者態度,如“支持、反對”。stance detection雖然也屬於文本分類,但和基於主題的文本分類、情感分類有些差異,stance的表達是更隱晦的,因此分類難度更大。在此列出自己閱讀論文的列表,部分論文直接列出一些簡單的筆記,這些論文可讀性不強(方法過於簡單,或者論文本身的貢獻不在方法上,沒有太多記錄成筆記的價值…),部分論文會逐步完善,給出簡單的閱讀筆記。閱讀價值評分純粹是基於自己對於文章的理解,標準包括:動機、方法、數據集質量、實驗安排、相關工作等,滿分爲5(相對評分,即分值高低僅反映論文在以下列表中的可讀價值,並不一定說明這篇文章有多好)。列表如下:
名稱 | 所屬會議(來源) | 類型 | 時間 | 閱讀價值 | 筆記 |
---|---|---|---|---|---|
Modeling Stance in Student Essays | ACL | long paper | 2016 | 1 | 自己構建的student essay數據集,包含800多篇,6分類;構建了很多特徵,其中path-based features可以看看。實驗效果比前人的基於feature set的模型要好一點。 |
Hawkes Processes for Continuous Time Sequence Classification: an Application to Rumour Stance Classification in Twitter | ACL | short paper | 2016 | 1 | 較早的一篇文章,稍微看看就好。裏面將Twitter轉化爲時序,進而用統計學模型進行求解的轉化思路值得借鑑。 |
A Multidimensional Lexicon for Interpersonal Stancetaking Umashanthi | ACL | long paper | 2017 | 1 | … |
Cross-Target Stance Classification with Self-Attention Networks | ACL | short paper | 2018 | 3.5 | 在具有相似預測目標的不同態度分類數據集上進行遷移學習。將模型從數據集A中學習到的關於target的知識運用到數據集B的目標預測上。劃重點,遷移學習。 |
Weakly-Guided User Stance Prediction via Joint Modeling of Content and Social Interaction | CIKM | long paper | 2017 | 2.5 | 無監督的stance prediction。自己爬取的CNN news和4Forums;由於數據是跟debate forum相關的,因此每條post都有有十分豐富的上下文,並且上下文不同post之間會產生關係(支持、反駁等)。模型先根據一系列的上下文和不同post之間的關係,得出不同立場的詞表,再得出用戶在該topic下的stance極性打分。模型的具體方法沒有細看,運用了一些啓發式規則和限制條件下的最優化方法。本文的問題是圍繞debate forum展開,數據集具有一定的特性,不同用戶的相互支持、反駁使得能夠無監督地聚類不同態度的詞彙表達。這和之前接觸的stance detection任務不太相同。 |
A Temporal Attentional Model for Rumor Stance Classification | CIKM | short paper | 2017 | 4 | TO BE CONTINUED |
A Joint Sentiment-Target-Stance Model for Stance Classification in Tweets | COLING | long paper | 2016 | 2.5 | SemEval 2016 task 6;前人工作在建模stance時,會將target和sentiment作爲額外特徵。而本文針對stance、target、sentiment聯合建模。使用了概率圖模型,反覆看了幾遍沒看懂,暫時放棄。。。聯合建模sentiment、target、stance,思路很好,但是方法上不太理解。或許將target、sentiment作爲輔助信息加入NN,或者利用網絡結構進行聯合建模能更好地捕捉信息? |
UTCNN: a Deep Learning Model of Stance Classificationon on Social Media Text | COLING | long paper | 2016 | 3.5 | TO BE CONTINUED |
Stance Classification in Rumours as a Sequential Task Exploiting the Tree Structure of Social Media Conversations | COLING | long paper | 2017 | 3.5 | TO BE CONTINUED |
Scrutable Feature Sets for Stance Classificatio | COLING | wordshop | 2016 | 1 | … |
Structured Representation Learning for Online Debate Stance Prediction | COLING | long paper | 2018 | 2 | online debate stance prediction。4FORUMS,CREATEDEBATE的數據;文章將debate forum中的各類信息進行embedding,通過text embedding的相似性來找已知stance和待預測stance的embedding相似性。文中還針對一些依賴關係添加了限制條件。和另一篇CIKM2017的文章一樣,都是討論的debate forum的stance detection。不過跟目前要做的問題有差別。 |
Stance Detection with Hierarchical Attention Network | COLING | long paper | 2018 | 4 | TO BE CONTINUED |
Predicting Stances from Social Media Posts using Factorization Machines | COLING | long paper | 2018 | 2 | stance detection on silent user。自己爬取的Twitter日語數據;使用FM進行建模,利用了四部分信息作爲特徵:用戶信息、topic信息、用戶在其它topic上的stance、用戶的posts。實驗部分只進行了各部分特徵的實驗,以及多數投票的baseline。角度新穎,但文章集裏幾乎沒人做,數據也是用的自己的爬的。如果之後用FM的話可以回過頭來看。 |
Can Rumour Stance Alone Predict Veracity? | COLING | long paper | 2018 | 1 | … |
A Retrospective Analysis of the Fake News Challenge Stance Detection Task | COLING | 2018 | long paper | 4.5 | TO BE CONTINUED |
A Dataset for Multi-Target Stance Classification | EACL | long paper | 2017 | 3 | 這篇文章主要是提出了一個數據集,但這個問題和正在做的AIC、DF是類似的,即一個樣本中含有多個target,需要預測對於不同target的態度(情感)。本篇文章也提出了一個框架,利用seq2seq,decoder端利用target1的label作爲target2的預測輸入一部分。這種方法假定了target之間是有關聯的,比如針對兩位選舉候選人的看法,因此數據集構建中也是每條數據包含了兩個target。這樣還是把問題做的太細了,假設也太強,距離AIC、DF的實際問題還很遠。 |
Stance Classification of Context-Dependent Claims | NAACL | long paper | 2016 | 2.5 | 一篇比較水的文章,paper2paper的工作,在IBM之前構建的claim數據集上進行stance的檢測。分爲三步:1、識別給定topic和claim的目標;2、識別對應目標的情感;3、確定針對目標的表意是否一致。三部分的模型都用的傳統方法,包括句法樹、情感詞、條件概率等。 |
Topical Stance Detection for Twitter: A Two-Phase LSTM Model Using Attention | ECIR | journal | 2018 | 4 | TO BE CONTINUED |
Stance Detection with Bidirectional Conditional Encoding | EMNLP | long paper | 2016 | 4.5 | TO BE CONTINUED |
ConStance: Modeling Annotation Contexts to Improve Stance Classification | EMNLP | long paper | 2017 | 1 | … |
From Clickbait to Fake News Detection: An Approach based on Detecting the Stance of Headlines to Articles | EMNLP | short paper | 2017 | 2.5 | FNC-1;兩階段方法,先使用基於詞形還原的n-gram來對headline和body的匹配度打分(自定義的公式),二分類爲是否相關,若相關則使用LR繼續判定細分的類別。這是FNC-1的9th的解法,很簡單。足以反映基於詞頻、只依賴詞頻的模型已經能很好地解決這一問題。9th的得分爲9270,1st爲9556,並不需要神經網絡。 |
Fake News Detection using Stacked Ensemble of Classifiers | EMNLP | workshop | 2017 | 1 | … |
Stance classification with target-specific neural attention networks | IJCAI | long paper | 2017 | 4.5 | TO BE CONTINUED |
Integrating Stance Detection and Fact Checking in a Unified Corpus | NAACL | short paper | 2018 | 1 | … |
360 Stance Detection | NAACL | shrot paper | 2018 | 2 | 自己爬的數據集;本文主要實現了一個web工具,用戶輸入一個query(topic),工具自動展示各大消息網站關於該topic的相關內容,以及標註的stance。 |
Automatic Stance Detection Using End-to-End Memory Networks | NAACL | long paper | 2018 | 4.5 | TO BE CONTINUED |
Overview of NLPCC Shared Task 4: Stance Detection in Chinese Microblogs | NLPCC | 2016 | 3.5 | NLPCC 2016 shared task 4 的官方總結文章。主辦方以新浪微博爲數據源,採集了5個target共3000條數據做訓練集(subtask A),數據是由學生標的。top-1選手使用的是手工特徵+SVM/RF,其他也大多使用的是手工特徵。在文章集中很少看到使用這個數據集的,方法不具有太大的創新價值,都發表在了NLPCC上,方法也多爲傳統方法。文章前面關於stance detection的任務定義、與情感分析的區別總結的很好,值得一看。以後如果要使用該數據集並進行結果對比時,再回來索引相關參賽隊伍的文章。 | |
Multi-Target Stance Detection via a Dynamic Memory-Augmented Network | SIGIR | short paper | 2018 | 4 | TO BE CONTINUED |
SemEval-2016 Task 6: Detecting Stance in Tweets | SemEval | 2016 | 5 | TO BE CONTINUED | |
SemEval-2017 Task 8: RumourEval: Determining rumour veracity and support for rumours | SemEval | 2017 | 5 | TO BE CONTINUED | |
Detect Rumor and Stance Jointly by Neural Multi-task Learning | WWW | long paper | 2018 | 4 | TO BE CONTINUED |
Ranking-based Method for News Stance Detection | WWW | short paper | 2018 | 3.5 | TO BE CONTINUED |
Combining Neural, Statistical and External Features for Fake News Stance Identification | WWW | long paper | 2018 | 4 | TO BE CONTINUED |
Detect Rumor and Stance Jointly by Neural Multi-task Learning | WWW | workshop | 2018 | 4 | FNC-1;三路神經網絡分別編碼:詞向量特徵、TF特徵、外部特徵。其中使用了skip-thought embedding,說可以衡量句子相似度。之後要去看一下。然後模型結構很普適,神經網絡分別建模各部分特徵,再由另一個神經網絡來組合特徵表示。 |
Detection and Resolution of Rumours in Social Media: A Survey | ACM Computing Surveys | journal | 2018 | 5 | Survey |
Combining Similarity Features and Deep Representation Learning for Stance Detection in the Context of Checking Fake News | ACM Journal of Data and Information Quality | journal | 2018 | 5 | TO BE CONTINUED |
縮寫解釋:
- AIC:AI Challenger
- DF:Data Fountain
- FNC-1:Fake News Challenge — 1st period
TO BE CONTINUED 標註的論文,會在後面單開博文來詳細講。