互信息 Mutual Information

互信息(Mutual Information)在統計語言模型中被廣泛採用。如果用A表示包含詞條t且屬於類別c的文檔頻數,B爲包含t但是不屬於c的文檔頻數,C表示屬於c但是不包含t的文檔頻數,N表示語料中文檔總數,t和c的互信息可由下式計算:
MI(t,c) = log2{(A*N)/(A+B)*(A+C)}

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章