反作弊介紹

原文鏈接:https://blog.csdn.net/u013185349/article/details/85158659

反作弊

反作弊主要業務流程:

 

常見作弊方式:

機器作弊:機器刷量、任務分發、流量劫持

人爲作弊:QQ羣/水軍、直接人工、誘導

 

常見作弊手段:

電商:刷單,刷信譽,刷好評,職業差評師

支付平臺:洗錢,詐騙

廣告:數據造假、刷流量 (引流—廣告展示—廣告點擊—轉化)

自媒體、社交軟件:刷粉絲、刷點擊、閱讀量

搜索:seo使用作弊手段刷排名(案例:2015蜻蜓FM “普羅米修斯”、“宙斯”函數,修改轉化量、流量在前端展現欺騙投資人,被對手反編譯識破)

 

廣告作弊涉及的點擊類型分類:

1、  按照是否找商品找服務爲目的

2、  是否按照是否惡意,有無真實轉化爲依據

(CPC基於點擊計費的模式、CPA基於成交的點擊進行收費)

 

點擊四大分類:

無效點擊(沒有形成轉化的意願,僅僅瀏覽)

惡意點擊(必須識別出來)

轉化點擊(真實意願點擊)

誤點(不是以找商品爲目的,例如內部人員點擊,需要識別出來)

 

人羣劃分:

誤點:員工、廣告主自己、競品銷售中介、爬蟲

惡意點擊:同行、同行朋友、聯盟站點、機器

 

反作弊策略應對框架:

數據層:鼠標軌跡行爲、指紋數據、案例庫、行爲數據

特徵層:離散指標、連續指標

行爲識別層:點擊識別模型、異常監測模型、流量識別模型、關係圖模型、人羣識別模型

策略應對層:規則

 

三層監控指標體系,提前預警:

運營指標監控:投訴率、轉化率、撞線速率/頻率、消耗速率、通過率

規則監控指標:攔截率、準確率、覆蓋率

異常監控指標:IP維度、Cookie維度、計費名維度、廣告維度、設備維度、鼠標軌跡維度

 

分類監控、分級響應:

1、  針對監控情況、採用四級響應機制;

2、  紅色:非常嚴重,需要自動化採取短期策略應對,例如臨時黑名單機制

3、  橙色:較爲嚴重,短信舉報,要求4h內完成分析和短平快策略壓制,後續進一步處理

 

機器學習在反作弊應用幾個案例:

如關聯規則、決策樹模型:策略挖掘—規則自動提取

確定建模問題:自動發現規則、輔助策略設計;

應用:挖出的規則,上線到離線反作弊系統

評估指標:支持度、置信度、覆蓋率、攔截率

 

流量聚類分級模型,kmeans算法:異常行爲識別—流量識別

作用:支持流量分級打折策略

例如分爲以下類別,特徵描述:

1、  主要爲品牌瀏覽器入口,轉化效果較好,用戶粘性較高;

2、  電話轉化很好,包括搜索行爲、點擊行爲、轉化行爲都較好;

3、  電話轉化良好,沒有明顯的特徵異常;

4、  電話轉化率略偏低,詳情頁其它點擊行爲略偏少;

5、  詳情頁停留時間短,轉化效果特別差;

6、  電話轉化很好,無其它任何轉化行爲,專門點擊商業廣告,行爲非常異常;

7、  點擊率高,無轉化,行爲非常異常.

 

如半監督或圖算法:異常行爲識別—基於關係發現:

作弊用戶標籤比較少,如何召回更多的數量?

藉助半監督或圖算法發現更多的異常用戶·

 

SVM算法:異常行爲識別—銷售識別

作用:識別用戶是否銷售

數據來源:行爲日誌,聊天記錄

懲罰係數C,選擇RBF函數作爲kernel的參數gamma的選擇.

粗粒度搜索:

  對大數據集,先選擇一個較小的子集做粗粒度搜索;

  選擇較大的步長,找到一個最優的(c,g)局部區域.

細粒度搜索:

       在局部區域,以較小的步長,找到全局最優的(c,g)

 

如圖論與餘弦距離:搜索引擎防作弊

圖論:作弊的網站一般需要相互鏈接,以提高自己的排名,這樣在互聯網大圖中形成一些Clique.圖論中有專門發現Clique的方法.

餘弦距離:那些賣鏈接的網站,都有大量的出鏈(這些出鏈的特點和不作弊的網站出鏈特點大不相同).每一個網站到其他網站的出鏈數目可以作爲一個向量,計算餘弦距離.發現,有些網站的出鏈向量之間的餘弦距離幾乎爲1.一般來講這些網站通常是一個人建的,目的只有一個:賣鏈接.

在淘寶上,有一種算法叫做“千人千面算法”,首先來看下作弊的幾個方面:

1、同IP

也就是說你朋友都不能買你的東西,因爲你們兩個人早晚是會在一起碰面的,兩個人碰面就是IP碰面,所以,買你寶貝的那個人,你們兩個人的IP永遠不能相見,也就是說你們兩個人永遠不能相見!

2、性別

假如你的淘寶店鋪賣的是連衣裙,老是有男買家隔三差五的在你家買這件寶貝,你覺着正常,男朋友幫買怎麼了?我用男朋友的號買怎麼了?可是算法認爲你是在作弊!你是在刷寶貝!

3、行爲

這種行爲指的就是假如你在刷寶貝,你沒有具體的流程,每一個幫你刷流量的人都是搜索關鍵詞,找到你家寶貝,點擊收藏,加入購物車,然後下單,你都覺着不可能,更別說算法了!

4、年齡

你家淘寶店鋪賣的是絲襪,行,你男朋友幫你買,可是你找的人都有40歲往上的,誰家40歲的男人幫媳婦在網上買絲襪?最好就是你找18-30歲之間的女性刷寶貝是最正常不過的了!

5、能力

支付寶都是實名認證的,對我們的好多都瞭如執掌,你賣意大利名牌古弛,你卻老是找一些大學生幫你刷單,這就肯定是有問題的,學生能力有限,沒有工作,買這麼名貴的皮具肯定也是有些問題的!

使用關聯規則檢測刷單作弊行爲

最近發現我們平臺上的個別內容提供商使用一些違規的手段,對自己所屬的收費內容進行刷單作弊。從其他渠道以很優惠的價格購買代金券,在平臺消費自己的項目內容,從而獲得結算分成與成本的金額差價。

因爲需要對該問題進一步重視和監控,我也在考慮一些檢測方法,其中一個就是本文介紹的基於數據挖掘中的關聯規則(Association Rules)的算法進行嘗試分析。對於關聯規則的算法原理在此就不贅述。

家喻戶曉的一個利用關聯規則的案例是沃爾瑪啤酒尿布的案例,目的是發現客戶購物籃中經常被同時購買的商品。本例與啤酒尿布案例類似。主要因爲內容商使用低價購買的客戶賬號購買自己的商品,但基於以下分析,本案例中可能會產生較強的關聯效應:

(1)對同一批內容商品進行購買,會節約作弊成本。

(2)由於客戶帳號有限,必將會出現一個客戶賬號購買很多內容項目的現象。

而與沃爾瑪的案例不同的是,沃爾瑪的案例是探索的正向積極的事件,本例是要發現的是負向消極的事件。沃爾瑪的案例中要求事件的支持度(support)要較高,即事件能夠經常發生纔能有意義,置信度(confidence)只要適當即可,不要求過高;而本例因爲是需要稽查異常,所以不能要求支持度高,相反置信度一定要比較高,即當某時間發生以後,另一關聯的時間也發生的概率要很高才行。

 

使用反作弊算法檢測刷單作弊行爲

以Amazon的Review算法爲例:

001

Verified Purchase。直評已死,這個時候再去刷直評非但沒有意義,反而可能會出現如上圖羣聊中出現的“上好評排名會跌”的情況。

所以要刷就刷VP吧。還記得年初的封號風波嗎,這些賣家大多數是因爲刷單被姐夫“秋後算賬”;船長在之前的分享中有向大家提到一個刷單建議,模仿真實購買行爲。

亞馬遜希望所有的評論都是誠實的,而在他的監控中,如果我們能做到“仿真”,也就能避開懲罰了。具體如何模仿真實購買行爲地刷單,我們根據下文的影響因素一一分析。

002

留評頻率與間隔時間。留評頻率越高,間隔時間越短,權重就越高。

如果一款產品不斷地來好評,這就意味着該產品受歡迎。也就是說,你需要根據自己的產品特性來規劃規劃刷單的頻率,留評的頻率,留評間隔的時間。當然,時間和頻率的把控同時也需要考慮到產品的銷售週期,比如你不能在站點的冬季持續刷泳裝的單並留評論,是吧。

既然說到時間和頻率,大家在刷單刷評是需要注意,一般情況下,在買家真實購買行爲中,賬號成交量平均一個月最多10-20單,留評數量不超過10%,在越來越苛刻的評論政策之下,不超過5%是最好的。

也就是說,大家在選擇刷單資源,或者自己組建刷單團隊時,除了需要規劃好在listing上留評的時間與頻率,也需要根據成交情況、留評時間與頻率篩選合適的買家賬號。

003

字數、內容與比例,也就是評論內容的質量。刷單需求越大,刷單者的胃口也被養得很大,賣家們經常會花了很多錢卻被隨便一個“good”或者“wonderful”的五星敷衍了事,在現在新的算法之下,這類屬於低價值的評論是對權重排名沒有幫助的。

Review都有專員審覈,亞馬遜希望review能夠真實反映產品的情況,給買家參考,避免產生不良購物體驗,客觀豐富完整的review內容是能夠提高權重的。

現在刷評論的一個標準,要讓買家當真,也要讓姐夫當真。站在真實買家(產品購買者、使用者)的角度去客觀評價這個產品,甚至不全是五星好評;根據客服提供的依據,還需要有有趣且幽默的評論內容並且數量要在最新10個reviews中佔一定比例的,比如每10個評論(包括好評、中評和差評)至少1-2個有趣的評論,以此類推。

如果評論的內容不知道怎麼下手,可以通過查詢競爭對手的review,挑選靠前、內容較豐富並且“helpful”數量較多的VP評論模仿,切記是模仿不是照搬照抄。至於有趣的內容,最好搭配相關的、有趣的圖片或視頻,特別是童裝、玩具這些嬰兒的產品,可以利用的素材就更多了。

004

Review中的“helpful”數量。這是個陷阱!點擊“helpful”(俗稱“點贊”)也是需要買家賬號,但如果你不小心用了一些“質量差”的買家賬號刷點擊,那就完蛋了。

首先,使用質量好的買家賬號。上文中船長也有介紹到,真實買家賬號成交量平均一個月最多10-20單,留評數量不超過10%,另外還需要注意的是賬號使用年限和使用習慣,一般來說,越老的賬號越好,但拒絕老殭屍號;並且,買家賬號也要防關聯,關聯條件與賣家賬號相同。

接着,用這些質量好的買家賬號模仿真實的買家點贊行爲。從登錄買家賬號到點贊,一般是需要經過這些步驟的:

1→搜索:通過亞馬遜前臺鍵入你的產品關鍵詞,或者通過你的產品對應品類去搜索,也可以通過品牌名搜索(小賣家不建議直接搜索品牌名)。

2→對比:一頁頁去找你的listing,查找過程中隨意點擊幾個別人家的listings瀏覽幾秒鐘,翻翻評價和Q&A,並在兩三個產品頁面停留時間稍久一些。

3→點贊:一番操作後找到你的產品,到評論區後也不要馬上找到目標review點贊,可以瀏覽首頁或前幾頁的評論,翻開摺疊的回覆查看,點開圖片或者視頻,甚至離開這個產品頁面之後再回來瀏覽、點贊。

005

Review原星級分數,即原來Review星級的分數;這個影響因素已經沒法去改變,但不代表原先分數低現在就沒法提高,從其他因素着手去優化即可。

006

詳情頁面被點擊次數、買家離開該詳情頁面次數、買家又再次返回該詳情頁面比率。其實就是要按照買家正常購買的順序邏輯,換位思考,你在網購商品的時候是怎樣操作的,就按照類似的順序邏輯去刷單就是了。

除了review算法的改變,亞馬遜也更新了“評論服務條款”,進一步保護review的真實性,同時也制定了懲罰政策,簡單講就是,操控評論,後果很嚴重。

但是,不刷單是不可能的,特別是對於新產品,沒有銷量就沒有評論,沒有評論就沒有排名,沒有排名就沒有銷量。

上文中船長給大家的建議是“模仿真實購買行爲”的刷單方法,雖然複雜,成本也比較大,但是能降低一定的風險。當然,如果你是不刷單的乖乖賣家,除了坐等買家評價,你也該主動通過郵件索評增加真實review。

船長www.amzcaptain.com的【CRM-系統智能營銷-索取好評】功能十分成熟了,並且配備英、法、德、意、西、日6語種的索評郵件模板,適應9大站點。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章