特徵選擇
熵的概念:
熵的作用:
用來描述隨機變量分佈的不確定性。
熵的數學表示:
假設一個樣本空間,其中包含n個獨立的事件,每個事件發生的概率爲。
當每個事件發生的概率相同,此時樣本空間的不確定性最高(你幾乎無法猜中哪個事件會發生)。
反之,當其中一個事件發生的很大,其餘都很小(如),此時事件的不確定性就比較低了,你幾乎可以猜中事件1會發生。
那麼熵的數學表達式需要具有上述特徵。
慢慢努力吧,會繼續寫的
用來描述隨機變量分佈的不確定性。
假設一個樣本空間,其中包含n個獨立的事件,每個事件發生的概率爲。
當每個事件發生的概率相同,此時樣本空間的不確定性最高(你幾乎無法猜中哪個事件會發生)。
反之,當其中一個事件發生的很大,其餘都很小(如),此時事件的不確定性就比較低了,你幾乎可以猜中事件1會發生。
那麼熵的數學表達式需要具有上述特徵。
慢慢努力吧,會繼續寫的
Bag-of-Words 1.文字問題 2. 什麼是Bag-of-Words(具體例子) 3. 侷限性 1.文字問題 文本建模的一個問題是它很雜亂,機器學習算法之類的技術更喜歡定義明確的
講解的很清楚: https://www.cnblogs.com/wangguchangqing/p/12021638.html