模糊數學學習筆記 5：模糊聚類

原創

Bonennult

2020-06-16 02:03

個人博客地址 Glooow，歡迎光臨~~~

文章目錄

現在想要對

n

個目標

U=\{x_1,...,x_n\}

分類，並且每個對象都有多個指標，也即

x_i=\{x_{i1},...,x_{im}\}

。

模糊聚類通常包括三個步驟：

建立模糊矩陣
建立模糊等價矩陣
進行聚類

1. 數據標準化

實際中各個指標的量綱與數量級很可能相差很大，比如高校評價指標中，可能包括科研經費、論文數量、獲獎數量等，數量級差別很大，這個時候就需要先對各項數據進行標準化。常用方法有

標準差標準化
$x_{ij}'=\frac{x_{ij}-\bar{x}_j}{\sigma_j}$
極差正規化
$\boldsymbol{x}_{i j}^{\prime \prime}=\frac{\boldsymbol{x}_{i j}^{\prime}-\min _{1 \leq i \leq n}\left\{\boldsymbol{x}_{i j}^{\prime}\right\}}{\max _{1}\left\{\boldsymbol{x}_{i j}^{\prime}\right\}-\min _{1: i \leqslant n}\left\{\boldsymbol{x}_{i j}^{\prime}\right\}}$
極差標準化
$x_{i j}^{\prime}=\frac{x_{i j}-\bar{x}_{i}}{\max \left\{x_{i j}\right\}-\min \left\{x_{i j}\right\}}$
最大值規格化
$x_{ij}'=\frac{x_{ij}}{\max{(x_{1j},x_{2j},...,x_{nj})}}$

2. 建立模糊相似矩陣

接下來需要確定不同對象之間的相似度，相似度的確定也有幾種常用度量：

1.1 相關係數類

1.2 距離類

1.3 貼近度類

3. 聚類

獲得模糊相似矩陣以後，需要首先求出傳遞閉包 $t(R)$ ，以獲得模糊等價矩陣，然後根據不同的閾值 $\lambda$ 進行聚類，然後再畫出動態聚類圖。

舉個栗子

求解過程如下

0. 特性指標矩陣	1. 數據標準化	2. 求模糊相似矩陣

3. 求傳遞閉包	4. 根據不同閾值聚類	5. 畫動態聚類圖

4. 其他問題

在實際應用過程中，還會出現一些其他問題，比如：

在實際應用中，如何選擇適當的 $\lambda$ ？從而給出一個較明確的聚類。

實際中最佳閾值的確定，可以由專家給出值；也可以應用 F-統計量確定最佳閾值。

如果不用傳遞閉包，直接對相似矩陣進行聚類會怎麼樣？

直接應用模糊相似矩陣進行聚類時，可以首先確定一個閾值 $\lambda$ ，然後根據截集獲得一系列聚類結果，由於模糊相似矩陣並不是等價矩陣，因此此時的聚類結果是不嚴謹的，後面需要對交集非空的集合進行合併（這裏可能表述的不清楚，看下面的例子就明白了）

當樣本點很多時（幾百萬甚至上千萬個像素），例如需要對一張圖片上的樣本點進行聚類，該怎麼辦？

可以應用模糊C均值法(FCM)

5. 模糊C均值法(FCM)

設 $x_i(i=1,2,...,n)$ 是n個樣本組成的樣本集合， $c$ 爲預定的類別數目， $u_{ij}$ 是第 $i$ 個樣本對於第 $j$ 類的隸屬度函數。用隸屬度函數定義的聚類損失函數可以寫爲
$\sum_{j=1}^{c} \sum_{i=1}^{n} u_{i j}^{m} d_{i j}^{2}=\sum_{j=1}^{c} \sum_{i=1}^{n} u_{i j}^{m}\left\|\mathbf{p}_{j}-\mathbf{x}_{i}\right\|^{2}$
其中 $m>1$ ， $P_j$ 是第 $j$ 類的聚類中心，後面會給出公式。通常也會假設 $\sum_j u_{ij}=1$ 。

下面則給出該算法的推導：爲了最小化損失函數，則可以應用 Lagrange 乘子法
$J=\sum_{i=1}^{n} \sum_{j=1}^{c} u_{i j}^{m} d_{i j}^{2}-\sum_{i=1}^{n} \lambda_{i}\left(\left(\sum_{j=1}^{c} u_{i j}\right)-1\right)$
對 $\lambda_i,u_{ij}$ 求偏導等於 0，則可以得到迭代公式爲
$u_{i j}=\frac{\left(\frac{1}{d_{i j}}\right)^{2 /(m-1)}}{\sum_{k=1}^{c}\left(\frac{1}{d_{i k}}\right)^{2 /(m-1)}} \\\mathbf{p}_{j}=\frac{\sum_{i=1}^{n} u_{i j}^{m} \mathbf{x}_{i}}{\sum_{i=1}^{n} u_{i j}^{m}}$
由此就可以給出 FCM 算法的框架

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

模糊數學學習筆記 5：模糊聚類

文章目錄

1. 數據標準化

2. 建立模糊相似矩陣

1.1 相關係數類

1.2 距離類

1.3 貼近度類

3. 聚類

4. 其他問題

5. 模糊C均值法(FCM)

vue項目獲取富文本編輯器wangEditor內容導出爲word（html轉word格式並下載）

dotnet C# 創建 X11 應用時設置窗口背景顏色

Navicat安裝與激活教程

TDengine docker安裝方法

vue3組件通信與props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的發佈時間

工作中用到的腳本合集

合併代碼時Beyond Compare設置

凸優化學習筆記 15：梯度方法

最優化方法 23：算子分裂法 & ADMM

最優化方法 22：近似點算法 PPA

最優化方法 18：近似點算子 Proximal Mapping

凸優化學習筆記 2：超平面分離定理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結