原创 集體智慧編程——博客文章聚類-Python實現

本章中實現了層次聚類算法和K均值算法,用於博客的聚類。使用的特徵爲詞向量。即特定詞在博客文章中出現的次數。 讀入數據 數據中行的第一個詞代表博客名,列的第一個詞代表單詞特徵。存儲的數字代表該詞在該博客中出現的次數。讀入該句子,用Pyt