原创 Brown Clustering算法和代碼學習

一、算法   布朗聚類是一種自底向上的層次聚類算法,基於n-gram模型和馬爾科夫鏈模型。布朗聚類是一種硬聚類,每一個詞都在且只在唯一的一個類中。    w是詞,c是詞所屬的類。   布朗聚類的輸入是一個語料庫,這個語料庫是一個詞序列,輸