主動學習假設:
1、在未標註數據中搜索的時間明顯要少於標註數據的時間。鏈接:Performance Thresholding in Practical Text Classification:
主動學習挑戰:
抽樣偏差:必須找到代表性的空間:能夠考慮小而有偏差的sample in AL
miss cluster
信息量比較大
比較有代表性
主動學習假設:
1、在未標註數據中搜索的時間明顯要少於標註數據的時間。鏈接:Performance Thresholding in Practical Text Classification:
主動學習挑戰:
抽樣偏差:必須找到代表性的空間:能夠考慮小而有偏差的sample in AL
miss cluster
信息量比較大
比較有代表性