數據分析實戰-Kaggle-Twitter情感識別-基於Spacy的語句提取

目錄

 

一、題目解析

二、開發環境

三、數據分析過程


一、題目解析

英文題目:

"My ridiculous dog is amazing." [sentiment: positive]

With all of the tweets circulating every second it is hard to tell whether the sentiment behind a specific tweet will impact a company, or a person's, brand for being viral (positive), or devastate profit because it strikes a negative tone. Capturing sentiment in language is important in these times where decisions and reactions are created and updated in seconds. But, which words actually lead to the sentiment description? In this competition you will need to pick out the part of the tweet (word or phrase) that reflects the sentiment.

中文解析:其實我一開始沒弄明白這是啥意思,直到看了數據,先給大家看數據吧。

train .csv

test.csv

最後需要提交的東西呢,就是select_text。所以題目的意思就是,根據text(這個是用戶真正發的內容)去提取selected_text,就是提取原文中能代表用戶心情的語句。目的是方便Twitter以後做輿論分析啥的吧,這個咱管不着。下面讓我們開始我們的分析之旅。

二、開發環境

Windows10 + Jupter Notebook(這個選擇也讓我吃了大虧,寫博客的時候沒有辦法直接上傳,只能通過先轉Latex再轉

PDF再轉長圖,我都要死了,垃圾csdn的markdown。)

需要源碼的同學可以在博客下面留言,我直接發。

三、數據分析過程

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章