用電行爲人工智能模式識別的理論和方法

1.數據預處理方法

通過對屬性進行規範化將屬性值按比例縮放,對於涉及神經網絡的分類算法將有助於加快學習階段的速度。對於基於距離的方法,規範化可以幫助防止具有較大初始值域的屬性與具有較小初始值域的屬性(如二元屬性)相比權重過大。目前常用的規範化方法有最大最小值規範化、平均數方差法、總和規範化、極大值規範化等。當使用同一聚類算法並以不同的規範化方式處理時,聚類結果往往不同,規範化方式的選擇對聚類效果影響很大,必須在負荷模式提取中加以考慮。這就要求在負荷模式提取時首先了解每種聚類方法在採用不同規範化方法時的性能好壞,以便得到準確可靠的聚類結果。

2.負荷模式識別的聚類方法

負荷模式提取通常用聚類技術實現,主要方法可分爲如下幾類:
(1)基於劃分的方法。基於劃分的聚類算法的基本思想爲:給定一個含有m個對象的數據集,劃分方法將構建k個分組,每個分組就代表一個聚類簇。而且每個簇至少包括1個對象,每個對象必須且僅屬於1個簇。對於給定的數據集,算法首先根據給定的要構建劃分的數目創建一個初始的分組,然後採用種迭代重定位的方法改變初始分組,使得每一次改進以後的分組方案都較前一個好。
(2)層次聚類方法。層次方法根據層次的分解方式不同可以分爲凝聚的或分裂的。凝聚的方法爲自底向上分解,首先將每個對象作爲單獨的一個組,然後合併相似的組,直到所有的組合併成一個(或滿足某個終止條件)。分裂的方法爲自頂向下分解,首先將所有的對象置於一個組中,在迭代的每步中,一個組被分裂爲更小的組,直到最終每個對象在單獨的一個組中(或滿足某個終止條件)。
(3)基於密度的方法。
基於密度的方法與大部分劃分方法不同,它不是基於各種各樣的距離,而是基於密度。其主要思想是:只要臨近區域的密度(對象或數據點的數目)超過某個閾值,就繼續聚類。該方法既可以過濾噪聲數據,也可以發現任意形狀的簇。
(4)基於模型的方法。基於模型的方法通過優化給定的數據和某些數學模型之間的擬合。主要包括統計學方法和神經網絡方法。
(5)模糊聚類。傳統聚類算法是一種硬劃分,把每個待識別對象嚴格劃分到每個類中,劃分界限是分明的。然而大多數對象實際上並沒有嚴格的屬性劃分,其在形態和類屬方面存在着中間性。利用模糊理論來處理聚類問題的方法稱爲模糊聚類分析。模糊聚類分析是對傳統硬劃分方法的一種改進,樣本屬於各個類別的隸屬度表達了樣本屬性的中間性。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章