第四章-在線激勵機制&離線激勵機制

【前言】隨着智能終端的普及,數據海量涌現,如火如荼的大數據時代隨之而來。在科技界流傳着一種說法,機器學習、衆包、雲計算三者被稱爲大數據時代的三大關鍵技術。而衆包作爲其中至關重要的一環,主要是用來收集數據,當然也包括數據的預處理操作,例如打標籤、做分類、真值估計等。但是,衆包中比較核心的問題就是如何激勵更多的用戶參與到感知任務中?如何提高數據的可靠性和質量?如何在獲取數據的同時保證用戶的安全隱私?諸如此類問題,學術界展開的深入的討論,下面我就從現行激勵機制的研究大分類來闡述一下具體概念。

1.何爲激勵機制

簡單描述,就是一套可以激勵具有感知設備的用戶加入感知任務,並提交高質可靠的感知數據,獲得收益的解決方案,其中我們用數學方法將其具體化,該激勵機制是最終目標是參與感知任務的用戶可以達到最大收益,平臺的效用也能達到最大化。前面的文章我也詳細講過了如何用數學公式表示,有興趣的可以移步文章:第一章-走近羣智感知,辨識廬山真面目

2.何爲離線激勵機制

圖一 離線激勵機制

 

 離線激勵機制,online incentive mechanism,通俗的講,就是在平臺的任務開始之前,利用拍賣、博弈等手段,對所有任務進行分配,任務結束以後支付報酬。當然該種激勵機制的前提是所有用戶從開始執行感知任務一直到任務結束,會一直在感知任務的區域,會持續不斷的上傳數據,不會中途離開,也就是通常所說的“truthful”的用戶。結合上圖,具體來說,分爲以下幾個步驟:

1.平臺發佈感知任務以及任務的具體要求。

2.用戶對上述任務進行投標,按照平臺要求的指定格式進行提交,包括感知時間、具體的報酬以及一些其他信息。

3.平臺採用貪心或者動態規劃等算法,根據上述用戶上傳的報酬等進行選擇獲勝者。

4.選擇出最終的獲勝者,然後通知用戶,獲勝者開始上傳數據。

5.上傳數據完成後,平臺支付報酬給參與任務的用戶。

3.何爲在線激勵機制

圖二 在線激勵機制

 

在線激勵機制,online incentive mechanism,簡單來講,就是根據用戶的參與情況、任務完成情況、數據上傳質量、所花費成本等因素,由平臺實時決策,對用戶的最終所付報酬進行動態調整過程。結合上圖,具體來講,分爲一下幾個步驟:

1.任務發佈者發佈他的感知任務,即需求,其中需求中包含對任務的一些描述和對參與用戶的一些基本要求,例如所需的數據量和質量,任務截止日期和預算等。

2.平臺根據參與用戶的分佈,自動將感測區域按照某種規則進行劃分。

3.同時,平臺根據請求感知的剩餘任務數和剩餘的任務預算逐個選擇參與者。 

4.平臺根據上一步的決策出來的獲勝用戶,發佈通知給他們,然後參與用戶在他開始提供數據之前請求回覆;

5.如果平臺決定接受他的請求,開始執行任務。平臺在收到傳感數據後,根據數據的質量等決策依據,對用戶提供獎勵。

 

4.寫在最後

本文是題主主要研究博弈論與羣智感知領域,看到該部分內容的時候,覺得收穫頗多。故再次將其展示與博客,爲了讓大家更多的瞭解羣智感知的真面目,另外一方面也會在後來做該方面工作的時候可以繼續去補充,希望能和大家共勉,一起去貢獻出更精彩的博客!

注:文章內容引用列表: 

1.Hui Gao Chi Harold Liu Jian Tang Dejun Yang Pan Hui Wendong Wang, “Online Quality-Aware Incentive Mechanism for Mobile Crowd Sensing with Extra Bonus”  IEEE Transactions on Mobile Computing,10.1109/TMC.2018.2877459.


題主只是一個入門的小學生,希望大家多多指教!如果該帖子確實能解決您的問題,望多多留言,謝謝!


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章