【畢設】文本情感標註

自己爬取的數據是沒有情感標註的,但是如果想要用機器學習的方法進行情感分析,就要進行情感標註。

以下記錄自己進行情感標註的過程。

因爲無標註,人工標註不知道怎麼搞,我是傾向於利用軟件進行標註分類。

武漢大學研發的ROSTCM6,優點:1.簡單方便的進行情感分類,可以分爲正面、負面、中性三種情感。2.可以及逆行詞頻統計

                                                       3.進行語義網絡模型的構建

                                           缺點:情感分類模式固定,不能進行多模式情感情感分類

因爲畢設內容需要多模式的情感分類,該軟件不太能滿足我的需求,所以再次找到一個軟件

精靈標註助手,進行嘗試,但是無法進行文本情感標註,因爲不知道輸入的文件格式什麼,csv和xml格式都嘗試了。沒有找到對應的文件

 

 嘗試很多次,但是還是失敗。。。但聽同學說,對圖片標註效果還是不錯的。

對了,當excel文件轉xml格式,有兩種方法,第一種:利用線上excel轉xml編輯器進行轉換,第二種方式:

個人感覺第二種方式更好點,打開之後不會亂碼。

 軟件嘗試無果之後,希望找到人工標註的方法,之後經過多次搜索,在多個平臺上網友留言說,一般文本的數據標註,大部分是人工標記,或者交給專業的標註公司來做。

之後,我就去查找衆包公司:京東衆智、點我服務。

留言、留聯繫方式。。但好像目前還是沒有人聯繫我(可能我不是大佬吧)

一邊等聯繫,一邊繼續尋找方法。

之後看到用情感字典進行情感標註,這個方法好像還行,下載了大連理工大學的情感詞典(如果需要請留言留郵箱免費送

現在就是調代碼

待續。。。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章