虛假新聞檢測數據集

1.FakeNewsNet
下載鏈接:https://github.com/KaiDMML/FakeNewsNet
說明:該數據集包含新聞內容和正確標註真假新聞標籤的社會語境特徵。
使用論文:
(1)A Stylometric Inquiry into Hyperpartisan and Fake News
(2)Exploiting Tri-Relationship for Fake News Detection
2.BuzzFeedNews
鏈接:https://github.com/BuzzFeedNews/2016-10-facebookfact-check/tree/master/data
說明:該數據集包括完整的Facebook新聞發佈於接近2016年美國大選從9月19日到23日以及9月26日和27日。
3.LIAR
鏈接:http://www.cs.ucsb.edu/~william/software.html
說明:該數據集是從PolitiFact收集,包括簡短陳述,例如新聞稿,電視
或電臺採訪,競選演講等,幷包含元數據。
使用論文:
(1)“Liar,LIar Pants on Fire”:A New Benchmark Dataset for Fake News Detection
(2)Multi-Source Multi-Class Fake News Detection
4.BS Detector
鏈接:https://github.com/bs-detector/bs-detector
說明:爲新聞瀏覽器導出的數據集,包含新聞內容和正確標註真假新聞標籤。
5.CREDBANK
鏈接:http://compsocial.github.io/CREDBANK-data/
說明:推特的大數據集,包含新聞內容和人工標註標籤。
數據集涉及的內容如下:
6.Twitter and Weibo DataSet
鏈接:https://github.com/majingCUHK/Rumor_RvNN
http://alt.qcri.org/˜wgao/data/rumdect.zip
說明:5000條言論帶着500w的轉發量
使用論文:
(1)CSI: A Hybrid Deep Model for Fake News Detection
(2)Detecting rumors from microblogs with recurrent neural network
(3)Early Detection of Fake News on Social Media Through Propagation Path Classification with Recurrent and Convolutional Networks
7.Twitter15 Twitter16
鏈接:https://www.dropbox.com/s/7ewzdrbelpmrnxu/rumdetect2017.zip?dl=0
說明:謠言數據
使用論文:
Detect Rumors in Microblog Posts Using Propagation Structure via Kernel Learning
8.推特語料
鏈接:http://www.cs.jhu.edu/svitlana/
說明:具體時間事件所蒐集的數據集
使用論文:
Separating Facts from Fiction Linguistic Models to Classify Suspicious and Trusted News Posts on Twitter
9.包含圖的假新聞數據集
鏈接:https://drive.google.com/open?id=0B3e3qZpPtccsMFo5bk9Ib3VCc2c
說明:文本+圖像
使用論文
TI-CNN: Convolutional Neural Networks for Fake News Detection
10.謠言數據集
鏈接:http://mia.kaist.ac.kr/publications/rumor.
說明:數據集包含三個維度:時間,結構和語言
使用論文:
Prominent features of rumor propagation in online social media

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章