ranker-Scaling Up Crowd-Sourcing to Very Large Datasets: A Case for Active Learning

論文Scaling Up Crowd-Sourcing to Very Large Datasets A Case for Active Learning提出兩種AL算法。

  首先找到分類器θ對未標註數據的不確定程度。然後讓crowd對這些數據進行標定。下邊介紹兩種不確定性方法。
下邊的u是未標記數據,但是是指未標註數據的每一個,而不是整體。

一:Uncertainty Algorithm

這裏寫圖片描述
這裏寫圖片描述
第二項計算公式:
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述

二:MinExpError Algorithm

這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
  所以說MinExpError scores算法結合了,question的難度(不確定性)和這個回答能夠提高我們分類器的結果的程度(影響較大的數據)。

三:附加小知識

這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章