基於外賣評論的輿情風控

業務背景

目前許多商家都有線上留言或者評論反饋平臺,消費者可以在這些平臺上通過留言表達自己對於消費商品的反饋。消費者的反饋包括表揚性的正向反饋,也有一些批評性質的負向反饋。商家需要掌握消費者對於產品的整體輿論取向來判斷自己的產品質量是否符合消費者需求,同時瞭解評論內容可以方便商家分析輿論導向,指導下一步產品研發工作。

業務痛點

目前許多酒店、餐飲、零售的留言平臺每天都有大量的留言產生,傳統的輿論情緒收集方案是通過人工統計的方式,但是這種方式較爲低效,很難針對大規模的輿論做出精確統計。需要自動化的手段收集並判斷留言平臺的輿論走向。

解決方案

PAI平臺提供了一套基於文本向量化以及分類的算法,可以基於歷史標記的正負留言內容生成分類模型,自動對平臺上的新增留言進行預測。該服務的整體框架已經基於PAI-Studio開發完成,基於真實的打標後的11987條外賣平臺評論數據,實現了自動化的正反面輿論風控,準確性達到75%左右。

1.人力要求:需要具備基礎的NLP及分類算法知識用於模型調試

2.開發週期:1-2天

3.數據要求:最好有超過千條的打標數據,數據越多效果越好

數據說明

基於外賣評論的輿情風控

 

參數名稱參數描述label標籤,1是正向評論,0爲負面評論review實際評論數據

流程說明

進入PAI-Studio產品:https://pai.data.aliyun.com/console

將數據導入,搭建如下算法架構:

基於外賣評論的輿情風控

 

1.數據源

上文提到的評論數據

2.停用詞

過濾一些助動詞以及標點符號,需要自己上傳停用詞表

基於外賣評論的輿情風控

 

3.文本向量化

利用Doc2vector算法把每個評論變成語意向量,每行是一個向量,每個向量代表一個評論的含義

基於外賣評論的輿情風控

 

4.生成分類模型

將向量化後的文本通過拆分算法拆分爲訓練集以及測試集,訓練集通過邏輯迴歸算法訓練生成二分類模型,該模型可以實現對於評論是正向評論或者負向評論的判斷。

5.模型效果驗證

通過混淆矩陣算法驗證模型的實際效果,

基於外賣評論的輿情風控

 

總結

本文提到的基於留言評論的輿情風控方案可以用PAI組件在1-2天時間內非常快速的實現,實現後可以批量的對於平臺上面的留言輿論進行智能化分析,並且隨着數據的累計,模型的準確性會逐漸增強。該方案適用用各種基於文本場景的分析,比如垃圾郵件分類、新聞正反情緒分類等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章