數學建模 matlab MATLAB機器學習 分類方法 支持向量機分類 乳腺癌的診斷

一、理論基礎

1.支持向量分類機的基本原理

在這裏插入圖片描述
1.1線性可分支支持向量分類機
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

1.2 線性支持向量分類機

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

1.3可分支支持向量分類機

在這裏插入圖片描述
在這裏插入圖片描述

1.4C-支持向量分類機

在這裏插入圖片描述
在這裏插入圖片描述

二、案列

1. 支持向量機的分類模型

支持向量機(Sport Vector Machine ,以下簡稱 SVM)是一種基於統計學習理論的 模式識別方法。在模式識別等領域獲得了廣泛的應用。其主要思想是這樣:找到一個超 平面,使得它能夠儘可能多的將兩類數據點正確地分開,同時使分開的兩類數據點距離 分類面遠,如圖 。
在這裏插入圖片描述
已知觀測樣本爲
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
將模型2換成一般的核函數K(x,y),可得一般的模型:
模型3
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
應用支持向量機時,可以按照線性可分、線性不可分、非線性可分、非線性不可分的順序求解。

2.乳腺癌的診斷

乳腺腫瘤通過穿刺採樣進行分析可以確定其爲良性的或爲惡性的。醫學研究發現 乳腺腫瘤病竈組織的細胞核顯微圖像的 10 個量化特徵:細胞核直徑、質地、周長、面 積、光滑度、緊密度、凹陷度、凹陷點數、對稱度、斷裂度與該腫瘤的性質有密切的關 系。現試圖根據已獲得的實驗數據建立起一種診斷乳腺腫瘤是良性還是惡性的方法。數 據來自已確診的 500 個病例,每個病例的一組數據包括採樣組織中各細胞核的這 10 個 特徵量的平均值、標準差和壞值共 30 個數據,並將這種方法用於另外 69 名已做穿刺 採樣分析的患者。 這個問題實際上屬於模式識別問題。什麼是模式呢?廣義地說,在自然界中可以 觀察的事物,如果我們能夠區別它們是否相同或是否相似,都可以稱之爲模式。人們爲 了掌握客觀事物,按事物相似的程度組成類別。模式識別的作用和目的就在於面對某一 具體事物時將其正確地歸入某一類別。 模式識別的方法很多,如數理統計方法、聚類分析方法等。
在這裏插入圖片描述
在這裏插入圖片描述
代碼:
在這裏插入圖片描述
根據模型一寫的!
運行結果:
在這裏插入圖片描述

3.例題總結:

1.讀取整個文件,並優化數據。刪除多餘無用的數據,並將所有數據數字化。
2.讀取已知樣本點,然後用mapstd函數進行標準化處理。
3.讀取待分類樣本點,然後用mapstd函數進行標準化處理。
4.用svmtrain函數和svmclassify函數對已知的樣本點進行向量分類。
5.最後,用svmclassify函數對待分類樣本點進行向量分類。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章