機器學習算法原理和思路

機器學習算法
有監督學習:分類和預測
1、KNN算法:通過計算未知數據和樣本距離中,數目最多類判斷未知類歸屬。

2、決策樹算法:通過信息增益來劃分類,然後逐級劃分到葉子節點。

3、貝葉斯算法:通過判斷文本拆分後和樣本比較出現的概率來確定是否過濾。

無監督學習:聚類和關聯
1、聚類算法:通過判斷相同屬性歸類。

2、關聯算法:通過計算樣本出現的次數概率,和所有頻繁項集同時出現的概率來判斷關聯程度。

半監督學習

這類問題給出的訓練數據,有一部分有標籤,有一部分沒有標籤。我們想學習出數據組織結構的同時,也能做相應的預測。此類問題相對應的機器學習算法有自訓練(Self-Training)、直推學習(Transductive Learning)、生成式模型(Generative Model)等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章