聚類概念
無監督問題(無標籤)
k-means算法
聚類:相似的東西分到一組
難點:評估,調參
指定一個K值,要得到簇的個數
質心:均值,向量各維取平均值
距離的度量:常用歐幾里得距離和餘弦相似度
工作流程:
聚類概念
無監督問題(無標籤)
k-means算法
聚類:相似的東西分到一組
難點:評估,調參
指定一個K值,要得到簇的個數
質心:均值,向量各維取平均值
距離的度量:常用歐幾里得距離和餘弦相似度
工作流程:
Bag-of-Words 1.文字問題 2. 什麼是Bag-of-Words(具體例子) 3. 侷限性 1.文字問題 文本建模的一個問題是它很雜亂,機器學習算法之類的技術更喜歡定義明確的
講解的很清楚: https://www.cnblogs.com/wangguchangqing/p/12021638.html