原文鏈接：https://blog.csdn.net/u013185349/article/details/85158659

反作弊

反作弊主要業務流程：

常見作弊方式：

機器作弊：機器刷量、任務分發、流量劫持

人爲作弊：QQ羣/水軍、直接人工、誘導

常見作弊手段：

電商：刷單，刷信譽，刷好評，職業差評師

支付平臺：洗錢，詐騙

廣告：數據造假、刷流量（引流—廣告展示—廣告點擊—轉化）

自媒體、社交軟件：刷粉絲、刷點擊、閱讀量

搜索：seo使用作弊手段刷排名（案例：2015蜻蜓FM “普羅米修斯”、“宙斯”函數，修改轉化量、流量在前端展現欺騙投資人，被對手反編譯識破）

廣告作弊涉及的點擊類型分類：

1、按照是否找商品找服務爲目的

2、是否按照是否惡意，有無真實轉化爲依據

（CPC基於點擊計費的模式、CPA基於成交的點擊進行收費）

點擊四大分類：

無效點擊（沒有形成轉化的意願，僅僅瀏覽）

惡意點擊（必須識別出來）

轉化點擊（真實意願點擊）

誤點（不是以找商品爲目的，例如內部人員點擊，需要識別出來）

人羣劃分：

誤點：員工、廣告主自己、競品銷售中介、爬蟲

惡意點擊：同行、同行朋友、聯盟站點、機器

反作弊策略應對框架：

數據層：鼠標軌跡行爲、指紋數據、案例庫、行爲數據

特徵層：離散指標、連續指標

行爲識別層：點擊識別模型、異常監測模型、流量識別模型、關係圖模型、人羣識別模型

策略應對層：規則

三層監控指標體系，提前預警：

運營指標監控：投訴率、轉化率、撞線速率/頻率、消耗速率、通過率

規則監控指標：攔截率、準確率、覆蓋率

異常監控指標：IP維度、Cookie維度、計費名維度、廣告維度、設備維度、鼠標軌跡維度

分類監控、分級響應：

1、針對監控情況、採用四級響應機制；

2、紅色：非常嚴重，需要自動化採取短期策略應對，例如臨時黑名單機制

3、橙色：較爲嚴重，短信舉報，要求4h內完成分析和短平快策略壓制，後續進一步處理

機器學習在反作弊應用幾個案例：

如關聯規則、決策樹模型：策略挖掘—規則自動提取

確定建模問題：自動發現規則、輔助策略設計；

應用：挖出的規則，上線到離線反作弊系統

評估指標：支持度、置信度、覆蓋率、攔截率

流量聚類分級模型，kmeans算法：異常行爲識別—流量識別

作用：支持流量分級打折策略

例如分爲以下類別，特徵描述：

1、主要爲品牌瀏覽器入口，轉化效果較好，用戶粘性較高；

2、電話轉化很好，包括搜索行爲、點擊行爲、轉化行爲都較好；

3、電話轉化良好，沒有明顯的特徵異常；

4、電話轉化率略偏低，詳情頁其它點擊行爲略偏少；

5、詳情頁停留時間短，轉化效果特別差；

6、電話轉化很好，無其它任何轉化行爲，專門點擊商業廣告，行爲非常異常；

7、點擊率高，無轉化，行爲非常異常.

如半監督或圖算法：異常行爲識別—基於關係發現：

作弊用戶標籤比較少，如何召回更多的數量？

藉助半監督或圖算法發現更多的異常用戶·

SVM算法：異常行爲識別—銷售識別

作用：識別用戶是否銷售

數據來源：行爲日誌，聊天記錄

懲罰係數C，選擇RBF函數作爲kernel的參數gamma的選擇.

粗粒度搜索：

　　對大數據集，先選擇一個較小的子集做粗粒度搜索；

　　選擇較大的步長，找到一個最優的（c,g）局部區域.

細粒度搜索：

在局部區域，以較小的步長，找到全局最優的（c,g）

如圖論與餘弦距離：搜索引擎防作弊

圖論：作弊的網站一般需要相互鏈接，以提高自己的排名，這樣在互聯網大圖中形成一些Clique.圖論中有專門發現Clique的方法.

餘弦距離：那些賣鏈接的網站，都有大量的出鏈（這些出鏈的特點和不作弊的網站出鏈特點大不相同）.每一個網站到其他網站的出鏈數目可以作爲一個向量，計算餘弦距離.發現，有些網站的出鏈向量之間的餘弦距離幾乎爲1.一般來講這些網站通常是一個人建的，目的只有一個:賣鏈接.

在淘寶上，有一種算法叫做“千人千面算法”，首先來看下作弊的幾個方面：

1、同IP

也就是說你朋友都不能買你的東西，因爲你們兩個人早晚是會在一起碰面的，兩個人碰面就是IP碰面，所以，買你寶貝的那個人，你們兩個人的IP永遠不能相見，也就是說你們兩個人永遠不能相見!

2、性別

假如你的淘寶店鋪賣的是連衣裙，老是有男買家隔三差五的在你家買這件寶貝，你覺着正常，男朋友幫買怎麼了?我用男朋友的號買怎麼了?可是算法認爲你是在作弊!你是在刷寶貝!

3、行爲

這種行爲指的就是假如你在刷寶貝，你沒有具體的流程，每一個幫你刷流量的人都是搜索關鍵詞，找到你家寶貝，點擊收藏，加入購物車，然後下單，你都覺着不可能，更別說算法了!

4、年齡

你家淘寶店鋪賣的是絲襪，行，你男朋友幫你買，可是你找的人都有40歲往上的，誰家40歲的男人幫媳婦在網上買絲襪?最好就是你找18-30歲之間的女性刷寶貝是最正常不過的了!

5、能力

支付寶都是實名認證的，對我們的好多都瞭如執掌，你賣意大利名牌古弛，你卻老是找一些大學生幫你刷單，這就肯定是有問題的，學生能力有限，沒有工作，買這麼名貴的皮具肯定也是有些問題的!

使用關聯規則檢測刷單作弊行爲

最近發現我們平臺上的個別內容提供商使用一些違規的手段，對自己所屬的收費內容進行刷單作弊。從其他渠道以很優惠的價格購買代金券，在平臺消費自己的項目內容，從而獲得結算分成與成本的金額差價。

因爲需要對該問題進一步重視和監控，我也在考慮一些檢測方法，其中一個就是本文介紹的基於數據挖掘中的關聯規則（Association Rules）的算法進行嘗試分析。對於關聯規則的算法原理在此就不贅述。

家喻戶曉的一個利用關聯規則的案例是沃爾瑪啤酒尿布的案例，目的是發現客戶購物籃中經常被同時購買的商品。本例與啤酒尿布案例類似。主要因爲內容商使用低價購買的客戶賬號購買自己的商品，但基於以下分析，本案例中可能會產生較強的關聯效應：

（1）對同一批內容商品進行購買，會節約作弊成本。

（2）由於客戶帳號有限，必將會出現一個客戶賬號購買很多內容項目的現象。

而與沃爾瑪的案例不同的是，沃爾瑪的案例是探索的正向積極的事件，本例是要發現的是負向消極的事件。沃爾瑪的案例中要求事件的支持度（support）要較高，即事件能夠經常發生纔能有意義，置信度（confidence）只要適當即可，不要求過高；而本例因爲是需要稽查異常，所以不能要求支持度高，相反置信度一定要比較高，即當某時間發生以後，另一關聯的時間也發生的概率要很高才行。

使用反作弊算法檢測刷單作弊行爲

以Amazon的Review算法爲例：

001

Verified Purchase。直評已死，這個時候再去刷直評非但沒有意義，反而可能會出現如上圖羣聊中出現的“上好評排名會跌”的情況。

所以要刷就刷VP吧。還記得年初的封號風波嗎，這些賣家大多數是因爲刷單被姐夫“秋後算賬”；船長在之前的分享中有向大家提到一個刷單建議，模仿真實購買行爲。

亞馬遜希望所有的評論都是誠實的，而在他的監控中，如果我們能做到“仿真”，也就能避開懲罰了。具體如何模仿真實購買行爲地刷單，我們根據下文的影響因素一一分析。

002

留評頻率與間隔時間。留評頻率越高，間隔時間越短，權重就越高。

如果一款產品不斷地來好評，這就意味着該產品受歡迎。也就是說，你需要根據自己的產品特性來規劃規劃刷單的頻率，留評的頻率，留評間隔的時間。當然，時間和頻率的把控同時也需要考慮到產品的銷售週期，比如你不能在站點的冬季持續刷泳裝的單並留評論，是吧。

既然說到時間和頻率，大家在刷單刷評是需要注意，一般情況下，在買家真實購買行爲中，賬號成交量平均一個月最多10-20單，留評數量不超過10%，在越來越苛刻的評論政策之下，不超過5%是最好的。

也就是說，大家在選擇刷單資源，或者自己組建刷單團隊時，除了需要規劃好在listing上留評的時間與頻率，也需要根據成交情況、留評時間與頻率篩選合適的買家賬號。

003

字數、內容與比例，也就是評論內容的質量。刷單需求越大，刷單者的胃口也被養得很大，賣家們經常會花了很多錢卻被隨便一個“good”或者“wonderful”的五星敷衍了事，在現在新的算法之下，這類屬於低價值的評論是對權重排名沒有幫助的。

Review都有專員審覈，亞馬遜希望review能夠真實反映產品的情況，給買家參考，避免產生不良購物體驗，客觀豐富完整的review內容是能夠提高權重的。

現在刷評論的一個標準，要讓買家當真，也要讓姐夫當真。站在真實買家（產品購買者、使用者）的角度去客觀評價這個產品，甚至不全是五星好評；根據客服提供的依據，還需要有有趣且幽默的評論內容並且數量要在最新10個reviews中佔一定比例的，比如每10個評論（包括好評、中評和差評）至少1-2個有趣的評論，以此類推。

如果評論的內容不知道怎麼下手，可以通過查詢競爭對手的review，挑選靠前、內容較豐富並且“helpful”數量較多的VP評論模仿，切記是模仿不是照搬照抄。至於有趣的內容，最好搭配相關的、有趣的圖片或視頻，特別是童裝、玩具這些嬰兒的產品，可以利用的素材就更多了。

004

Review中的“helpful”數量。這是個陷阱！點擊“helpful”（俗稱“點贊”）也是需要買家賬號，但如果你不小心用了一些“質量差”的買家賬號刷點擊，那就完蛋了。

首先，使用質量好的買家賬號。上文中船長也有介紹到，真實買家賬號成交量平均一個月最多10-20單，留評數量不超過10%，另外還需要注意的是賬號使用年限和使用習慣，一般來說，越老的賬號越好，但拒絕老殭屍號；並且，買家賬號也要防關聯，關聯條件與賣家賬號相同。

接着，用這些質量好的買家賬號模仿真實的買家點贊行爲。從登錄買家賬號到點贊，一般是需要經過這些步驟的：

1→搜索：通過亞馬遜前臺鍵入你的產品關鍵詞，或者通過你的產品對應品類去搜索，也可以通過品牌名搜索（小賣家不建議直接搜索品牌名）。

2→對比：一頁頁去找你的listing，查找過程中隨意點擊幾個別人家的listings瀏覽幾秒鐘，翻翻評價和Q&A，並在兩三個產品頁面停留時間稍久一些。

3→點贊：一番操作後找到你的產品，到評論區後也不要馬上找到目標review點贊，可以瀏覽首頁或前幾頁的評論，翻開摺疊的回覆查看，點開圖片或者視頻，甚至離開這個產品頁面之後再回來瀏覽、點贊。

005

Review原星級分數，即原來Review星級的分數；這個影響因素已經沒法去改變，但不代表原先分數低現在就沒法提高，從其他因素着手去優化即可。

006

詳情頁面被點擊次數、買家離開該詳情頁面次數、買家又再次返回該詳情頁面比率。其實就是要按照買家正常購買的順序邏輯，換位思考，你在網購商品的時候是怎樣操作的，就按照類似的順序邏輯去刷單就是了。

除了review算法的改變，亞馬遜也更新了“評論服務條款”，進一步保護review的真實性，同時也制定了懲罰政策，簡單講就是，操控評論，後果很嚴重。

但是，不刷單是不可能的，特別是對於新產品，沒有銷量就沒有評論，沒有評論就沒有排名，沒有排名就沒有銷量。

上文中船長給大家的建議是“模仿真實購買行爲”的刷單方法，雖然複雜，成本也比較大，但是能降低一定的風險。當然，如果你是不刷單的乖乖賣家，除了坐等買家評價，你也該主動通過郵件索評增加真實review。

船長www.amzcaptain.com的【CRM-系統智能營銷-索取好評】功能十分成熟了，並且配備英、法、德、意、西、日6語種的索評郵件模板，適應9大站點。

反作弊介紹

反作弊

在淘寶上，有一種算法叫做“千人千面算法”，首先來看下作弊的幾個方面：

使用關聯規則檢測刷單作弊行爲

使用反作弊算法檢測刷單作弊行爲

容器中nginx無法使用同一個網絡下的容器域名

Python: SunMoonTimeCalculator

NETCore中實現一個輕量無負擔的極簡任務調度ScheduleTask

docker使用特定的網絡

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

nodejs學習07——API

避免DbContext同時在多個線程調用

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

Ubuntu常用命令（用一點記一點）

如何用機器學習做廣告反作弊（一）

個人紀錄Ubuntu使用

跑通Pytorch1.0版本的Faster-RCNN，並訓練自己的數據集（一）

記pytorch版本faster-rcnn的一些坑

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結