灰色聚類評價模型

一、灰色系統理論

灰色是外延明確,內延不明確

1.1 基本概念

信息完全已知——白
信息完全未知——黑
部分信息明確,部分信息不明確——灰

1982年,中國學者鄧聚龍教授創立灰色系統理論,是一種研究少數據,貧信息不確定性問題的新方法。該理論以“部分信息已知,部分信息未知”的“少數據”,“貧信息”不確定性系統爲研究對象,主要通過對“部分”已知信息的挖掘,提取有價值的信息,實現對系統運行行爲、演化規律的正確描述和有效監控。

不確定性的系統四種常用的研究方法

  1. 灰色系統理論 (貧信息不確定)
  2. 模糊數學 (認知不確定)
  3. 粗糙集理論 (邊界不清晰)
  4. 概率統計 (隨機不確定)

不確定性系統的基本特徵

  • 信息不完全
  • 數據不準確.

1.2 灰數

灰數是指只知道取值範圍,不知其確切值,即在某一個範圍內取值不確定的數。通常用記號“\otimes”表示灰數。

灰數有以下幾類:

  1. 僅有下界的灰數 [a,+)\otimes \in \left[ a,+\infty \right)
  2. 僅有上界的灰數 (,a]\otimes \in \left( -\infty ,a \right]
  3. 區間灰數 [a,b]\otimes \in \left[ a,b \right]
  4. 連續灰數 或者 離散灰數 比如身高、體重,年齡

黑數 (,+)\otimes \in \left( -\infty ,+\infty \right) ,完全不確定
白數 =a\otimes =a ,完全確定

灰色評價方法是一種可以較有效解決評價指標難量化、難統計的問題的方法,受主觀因素影響小。計算過程簡單,可用原始數據進行直接計算,只要有代表性的少量樣本方能進行計算。

二、灰色聚類評價模型

灰色聚類可分爲兩種:一種爲灰色關聯聚類,用於同類因素的歸併;另一種是灰色白化權聚類,用於檢測觀測對象屬於何類。

灰色關聯聚類可以檢查是否存在若干因素大體屬於一類,使這一類的綜合平均指標或其中的具有代表性的因素來代表這一類因素,而使信息不受嚴重損失。

白化權聚類就是通過灰色理論中的白化權函數,計算各聚類對象對不同指標擁有的白化權值,以便區分其灰類的方法。通過此種方法檢驗觀測對象應歸屬於先前設定的何種類別,並確定評價結論。該方法對樣本量的多少和樣本有無規律均適用,計算量小,其量化結果不會違背定性分析的結論,適用於評價信息不確切不完全,具有典型灰色特徵的系統。

2.1 灰色關聯聚類模型

2.2 灰色變權聚類評價模型

設有 n 個聚類對象,m 個聚類指標,s 個不同灰類,對象 i 關於指標 j 的樣本觀測值爲
xij ,i=1,2,,nj=1,2,,m x_{ij}\ \text{,}i=1,2,\cdots ,n\text{;}j=1,2,\cdots ,m

設 j 指標 k 子類的白化權函數fjk()f_j^k\left( \cdot \right),一般來說,某個灰數的白化權函數是根據已知信息設計的,其中,幾種常見的函數及其圖像分別如圖
在這裏插入圖片描述
其中,xjk(1),xjk(2),xjk(3),xjk(4)x_j^k\left( 1 \right) ,x_j^k\left( 2 \right) ,x_j^k\left( 3 \right) ,x_j^k\left( 4 \right)fjk()f_j^k\left( \cdot \right)轉折點。

  1. 典型白話權函數
    fjk[xjk(1),xjk(2),xjk(3),xjk(4)] f_j^k\left[ x_j^k\left( 1 \right) ,x_j^k\left( 2 \right) ,x_j^k\left( 3 \right) ,x_j^k\left( 4 \right) \right]

在這裏插入圖片描述

典型白化權函數有:
在這裏插入圖片描述
2. 下限測度白化權函數
fjk[,,xjk(3),xjk(4)] f_j^k\left[ -,-,x_j^k\left( 3 \right) ,x_j^k\left( 4 \right) \right]
在這裏插入圖片描述
下限測度白化權函數有:

在這裏插入圖片描述
3. 適中測度白化權函數
fjk[xjk(1),xjk(2),,xjk(4)] f_j^k\left[ x_j^k\left( 1 \right) ,x_j^k\left( 2 \right) ,-,x_j^k\left( 4 \right) \right]

在這裏插入圖片描述
適中測度白化權函數有:

在這裏插入圖片描述
4. 上限測度白化權函數
fjk[xjk(1),xjk(2),,] f_j^k\left[ x_j^k\left( 1 \right) ,x_j^k\left( 2 \right) ,-,- \right]

在這裏插入圖片描述

上限測度白化權函數有:
在這裏插入圖片描述


定義λjk\lambda _j^k 爲 j 指標 k 子類的臨界值,因此

對於典型白化權函數有:
λjk=xjk(2)+xjk(3)2 \lambda _j^k=\frac{x_j^k\left( 2 \right) +x_j^k\left( 3 \right)}{2}

下限測度白化權函數有:
λjk=xjk(3) \lambda _j^k=x_j^k\left( 3 \right)

適中測度白化權函數有:
λjk=xjk(2) \lambda _j^k=x_j^k\left( 2 \right)

上限測度白化權函數有:
λjk=xjk(2) \lambda _j^k=x_j^k\left( 2 \right)


定義 j 指標 k 子類的權爲
ηjk=λjkj=1mλjk \eta _j^k=\frac{\lambda _j^k}{\sum_{j=1}^m{\lambda _j^k}}

m 爲 聚類指標個數


xijx_{ij} 爲對象 i 關於指標 j 的觀測值,fjk()f_j^k\left( \cdot \right) 爲 j 指標 k 子類白化權函數,ηjk\eta _j^k 爲 j 指標 k 子類的權,則稱

σjk=j=1mfjk(xij)ηjk \sigma _j^k=\sum_{j=1}^m{f_j^k\left( x_{ij} \right) \cdot \eta _j^k}

爲對象 i 屬於 灰類 k 的灰色變權聚類係數


對象 i 的聚類係數向量

σi=(σi1,σi2,,σis)=(j=1mfj1(xij)ηj1,j=1mfj2(xij)ηj2,,j=1mfjs(xij)ηjs) \sigma _i=\left( \sigma _i^1,\sigma _i^2,\cdots ,\sigma _i^s \right) =\left( \sum_{j=1}^m{f_j^1\left( x_{ij} \right) \cdot \eta _j^1,\sum_{j=1}^m{f_j^2\left( x_{ij} \right)}}\cdot \eta _j^2,\cdots ,\sum_{j=1}^m{f_j^s\left( x_{ij} \right)}\cdot \eta _j^s \right)
得到聚類係數矩陣
Σ=(σik)=[σ11σ12σ1sσ21σ22σ2sσn1σn2σns] \varSigma =\left( \sigma _i^k \right) =\left[ \begin{matrix} \sigma _1^1& \sigma _1^2& \cdots& \sigma _1^s\\ \sigma _2^1& \sigma _2^2& \cdots& \sigma _2^s\\ \vdots& \vdots& \ddots& \cdots\\ \sigma _n^1& \sigma _n^2& \cdots& \sigma _n^s\\ \end{matrix} \right]

max1ks{σik}=σik \underset{1\le k\le s}{\max}\left\{ \sigma _i^k \right\} =\sigma _i^{k\ *} ,則稱對象 i 屬於灰類 kk^*


2.3 白化權函數

最後,說一下,白話權函數

參考:《灰色系統教學中白化權函數的構造方法分析》——董奮義等

白化權函數的確定是灰色聚類評估過程中由定性分析到定量建模的關鍵環節,白化權函數是對灰數(灰類)內各元素取值的可能性大小的函數形式表達.

灰數的白化權函數,反映人們在主觀上掌握該灰數的信息,白化權函數是用來描述一個灰數對其取值範圍內不同數值的偏愛程度,一般來說,一個白化權函數是研究者根據已知信息設計的,沒有固定的程式,但曲線的起點和終點一般應有其含義

白化權函數是研究者根據已知信息設計的,對一個灰數或灰類對其取值範圍內不同數值的/偏愛程度的主觀判斷,並以定量描述的方式刻畫各數據點隸屬於該灰數或灰類的程度,必須明確的是,這種主觀判斷必須是對已知信息的客觀反映爲基礎

確定灰類白化權函數一般藉助圖形,白化權函數的關鍵是各轉折點的確定

三角白化權函數法:將指標的取值範圍看作一個區間,按照評估要求所需劃分的灰類數,將各個指標也相應地劃分爲各個區間,區間的劃分由實際情況、行業規範、國家標準或定性分析得到

白化權函數主要根據實際問題的背景,並基於現有的一些規範,且以定性分析爲主.不同的決策者對相同灰類給出的白化權函數經常會出現一定的差異

2.4 書中例子——三個經濟區如何劃分收入類別

在這裏插入圖片描述

設有三個經濟區,三個聚類指標分別爲種植業收入、畜牧業收入、工業收入。第 i 個經濟區關於第 j 個指標的樣本值 xij(i,j=1,2,3)x_{ij}\left( i,j=1,2,3 \right) 如矩陣A所示:

A=(xij)=一區二區三區[x11x12x13x21x22x23x31x32x33]指標1 指標2 指標3=[8020100403030109060] A=\left( x_{ij} \right) =\begin{array}{c} \text{一區}\\ \text{二區}\\ \text{三區}\\ \end{array}\overset{\text{指標1\ 指標2\ 指標}3}{\left[ \begin{matrix} x_{11}& x_{12}& x_{13}\\ x_{21}& x_{22}& x_{23}\\ x_{31}& x_{32}& x_{33}\\ \end{matrix} \right]}=\left[ \begin{matrix} 80& 20& 100\\ 40& 30& 30\\ 10& 90& 60\\ \end{matrix} \right]
試按高收入類(k=1)、中等收入類(k=2)、低收入類(k=3)進行聚類

解:
在這裏插入圖片描述

這個白化權函數的轉折點事如何確定的?

我的理解如下(可能有問題):

第一個,指標1(80,40,10),最大值爲80,最小值爲10
對於 f11f_1^1 ,即第 1 指標(種植業收入) 1 類(高收入類)的白化權函數

結合圖形,上限測度白化權函數
fjk[xjk(1),xjk(2),,] f_j^k\left[ x_j^k\left( 1 \right) ,x_j^k\left( 2 \right) ,-,- \right]

在這裏插入圖片描述

因爲是高收入類,所以最大值 80 確定爲 x11(2)x_1^1\left( 2 \right),其次,高收入類的最小值也要適當大於10,所以主觀確定30,也可以設爲20,40…


對於 f12f_1^2 即1指標 2 類(中等收入類)的白化權函數,結合圖

適中測度白化權函數
fjk[xjk(1),xjk(2),,xjk(4)] f_j^k\left[ x_j^k\left( 1 \right) ,x_j^k\left( 2 \right) ,-,x_j^k\left( 4 \right) \right]

在這裏插入圖片描述
因爲是中等收入類,最小的 x 就可以確定爲10(x12(1)x_1^2\left( 1 \right));最大的 x (x12(4)x_1^2\left( 4 \right))主觀確定在80,70,60都可以;中間的 x12(2)x_1^2\left( 2 \right) 可以是10-70/60之間的一個數,可以是 30 ,40 都行。


對於 f13f_1^3 即1指標 3 類(低收入類)的白化權函數,結合圖

下限測度白化權函數
fjk[,,xjk(3),xjk(4)] f_j^k\left[ -,-,x_j^k\left( 3 \right) ,x_j^k\left( 4 \right) \right]
在這裏插入圖片描述

因爲是低收入類,所以可以直接把 x13(3)x_1^3\left( 3 \right) 設爲指標 1 的最小值,x13(4)x_1^3\left( 4 \right)不超過 f12f_1^2 中的 x12(2)x_1^2\left( 2 \right)


在這裏插入圖片描述

在這裏插入圖片描述
在這裏插入圖片描述

下限測度白化權函數有:
λjk=xjk(3) \lambda _j^k=x_j^k\left( 3 \right)

適中測度白化權函數有:
λjk=xjk(2) \lambda _j^k=x_j^k\left( 2 \right)

上限測度白化權函數有:
λjk=xjk(2) \lambda _j^k=x_j^k\left( 2 \right)

在這裏插入圖片描述


由 j 指標 k 子類的權爲
ηjk=λjkj=1mλjk \eta _j^k=\frac{\lambda _j^k}{\sum_{j=1}^m{\lambda _j^k}}

在這裏插入圖片描述



σjk=j=1mfjk(xij)ηjk \sigma _j^k=\sum_{j=1}^m{f_j^k\left( x_{ij} \right) \cdot \eta _j^k}

當 i = 1 ,有
在這裏插入圖片描述

在這裏插入圖片描述


得到聚類係數矩陣
Σ=(σik)=[σ11σ12σ1sσ21σ22σ2sσn1σn2σns] \varSigma =\left( \sigma _i^k \right) =\left[ \begin{matrix} \sigma _1^1& \sigma _1^2& \cdots& \sigma _1^s\\ \sigma _2^1& \sigma _2^2& \cdots& \sigma _2^s\\ \vdots& \vdots& \ddots& \cdots\\ \sigma _n^1& \sigma _n^2& \cdots& \sigma _n^s\\ \end{matrix} \right]

max1ks{σik}=σik \underset{1\le k\le s}{\max}\left\{ \sigma _i^k \right\} =\sigma _i^{k\ *} ,則稱對象 i 屬於灰類 kk^*

最終
在這裏插入圖片描述

第一經濟區和第三經濟區屬於高收入類,第二經濟區屬於低收入類。並且有聚類係數,第一經濟區與第三經濟區之間仍然存在差別,如果將收入在細分,比如高、中等偏高、中、中等偏低、低五個灰類,則可以得出不同的結果。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章