A Review of Automated Methods for the Detection of Sickle Cell Disease

類型	說明
論文信息	A Review of Atutomated Methods for the Detection of Sickle Cell Disease Pradeep Kumar Das, Student Member, IEEE, Sukadev Meher, Member, IEEE, Rutuparna Panda, and Ajith Abraham, Senior Member, IEEE
會議期刊	IEEE 2019

介紹
第一部分	①紅細胞（Red Blood Cell, RBC）是組織與外界環境的氣體交換的關鍵角色 ②血紅蛋白（Haemoglobin）爲紅細胞中氧氣攜帶者。 ③一般來說血紅蛋白生命週期爲六週，其包含兩個alpha和兩個beta鏈。 ④鐮刀型紅細胞疾病（Sickle Cell Disease）源自於雙親的兩個血紅蛋白基因的非正常表達。 ⑤正常的紅細胞可存活120天，而鐮刀型紅細胞只能存活10至20天。 ⑥鐮刀型源於血紅蛋白S與脫氧分子的聚合過程。 ⑦細胞形態學是臨牀上分類的關鍵 ⑧由於細胞複雜的本質，如何從背景中分割出細胞以及精確計數是一項富有挑戰性的工作。 ⑨不均勻的像素值、噪聲、多元化的損傷細胞的信號強度又是影響醫學圖像分割的因素。 ⑩定位、形狀、尺寸、形成因子、延伸率、圓度、細胞紋理、橢圓度等都是決定分割效率的特徵因素。
第二部分
鐮刀型紅細胞檢測結構圖
說明	①預處理：提高圖像質量，限制噪聲以及抑制圖像失真。 ②分割：分離重疊的細胞，注重周圍血液成分（血漿、白細胞）的分離以及諸如血小板等的更小分子的剔除 - 分爲手動與自動兩類細胞分離技術 - 不清晰的邊界、不完美的手眼協作以及低對比度都會降低手工方法的性能 - 自動分割技術能夠從高維以及多模態圖像中提取信息
第三部分
綜述總體結構	Section I: Introduction Section II: Segmentaion techniques Section III: feature extraction methods Section IV: detailed analysis of classification techniques Section V: Techniques for both feature extraction and classification purposes Section VI: validation metrics Section VII: detailed analysis of results Section VIII future scope of the research Section IX: Conclusion

鐮刀型紅細胞分割方法
圖示
A. Region based Segmentaion
:–	:–
1) Contour and Shape based Technique	首先定義一個與目標邊界相似的輪廓，然後通過某種規則進行修改輪廓，使其接近滿足預先定義標準的期望邊界 ①Deformable Model (DM)：開始於任意曲線或平面，通過內外力更新 - 內力：負責在變形期間維持模型平滑性 - 外力：修改模型實現預期形狀或邊界 - 圖像特徵通過變形模板（Deforming template）提取 ②Active Contour: parametric active contour (PAC)，or geometric active contour (GAC) ③PAC: 在拉格朗日公式（Kagrangian Formulatioon）中，PAC被表示成參數化曲線 ④GAC: 基於歐拉公式（Euler Formula）的二維距離函數水平集 ⑤Snake：一種流行的能夠提取諸如線和邊的能量優化主動輪廓(Energy optimizing active contour)技術 - 多運用於運動跟蹤與立體匹配 - 不能處理曲線演變中的拓撲變化 ⑥Level Set：強調形狀和平面的數值分析，適用於追蹤修改拓撲的形狀，而傳統主動輪廓方法不能處理曲線拓撲變化由於GAC更少的計算複雜度以及曲線拓撲自適應本質就，其比PAC更優，Level Set能夠有效監測鐮刀型紅細胞輪廓，不僅有效找出重疊的細胞和細胞簇，還能最大限度降低噪聲並消除內部空洞 ⑦混合集合變形技術（Hybrid geometric deformable technique）：以結構化的方式利用基於邊緣和基於區域信息有效分割醫學圖像 ⑧主動外觀模型（Active Appearance Model, AAM）：其包含紋理信息和形狀信息，成功將紅細胞從背景中分割出來。
2) Region Growing	其將滿足預先增長標準的像素或子區域整合形成更大的區域。由一組種子點開始，每個種子點整合鄰近相似屬性的像素。爲了有效地進行圖像分割，區域增長技術常與邊緣檢測（Edge Detection Process）處理相結合
3) Region based Level Set Technique	基於水平集方法得到有效地輪廓，其能夠處理輪廓的拓撲變化通過K-means聚類、Fuzzy c means聚類以及高斯混合模型計算能量函數
4) Graph based technique	同時使用前景以及背景種子點檢測醫學圖像目標對象 - 最小割與最大流算法（Min Cut and Max Flow） - Region based statistical model: 能夠優化統計區域能量以解決噪聲以及非均勻強度變化降低基於圖的相關方法性能的問題

B. Thresholding Based Segmentaion
1) Global Thresholding	即Fixed threshold technique ①Entropy based fixed threshold ②Ostu’s threshold
2) Local Thresholding	①Manual Thresholding: 根據先驗知識以或少許簡單實驗選擇閾值，不能準確分割目標對象 ②Adaptive thresholding: 根據圖像信息自動評估閾值，因此更爲準確，具體分爲以下三類 - Edge based thresholding: Canny, Sobel, Laplacian edge detections - Region based thresholding - hybird thresholding

C. Clustering Based Segmentaion
1) Hard Clustering	目標對象或者像素要麼完全屬於一個類，要麼就不屬於該類 - K-means - Cluster seperation technique：使用橢圓調整技術（Ellipse Adjustment Technique）
2) Soft Clustering	目標對象或像素有對應每個聚類的概率 - Fuzzy c-means(FCM)：允許像素或對象屬於多個類，依據相似性標準，因此由於像素值不均勻以及噪聲的存在不能有效分割醫學圖像，帶有基於空間信息的成員函數的修改版FCM能夠解決這一問題 - Statistical Mixture Model：基於最大可能性（Maximum likelihood, ML）或最大後驗（Maximum a posterior）標準評估分佈可能性 - Gaussian mixture model(GMM): 基於高斯分佈評估像素值

C. Clustering Based Segmentaion

1) Hard Clustering

目標對象或者像素要麼完全屬於一個類，要麼就不屬於該類
- K-means
- Cluster seperation technique：使用橢圓調整技術（Ellipse Adjustment Technique）

2) Soft Clustering

目標對象或像素有對應每個聚類的概率
- Fuzzy c-means(FCM)：允許像素或對象屬於多個類，依據相似性標準，因此由於像素值不均勻以及噪聲的存在不能有效分割醫學圖像，帶有基於空間信息的成員函數的修改版FCM能夠解決這一問題
- Statistical Mixture Model：基於最大可能性（Maximum likelihood, ML）或最大後驗（Maximum a posterior）標準評估分佈可能性
- Gaussian mixture model(GMM): 基於高斯分佈評估像素值

特徵提取方法
形態學特徵（Morphological Features）	用於鐮刀型紅細胞分類
縱橫比（Aspect Ratio）	the ratio of major axis length (M) to the minor axis length (L) of a cell. $Aspect \, Ratio = \frac{M}{L}$
效率因子（Effect Factor）	a measure of a cells roundness. $Effect \, factor = \frac{4\pi\times Area}{Perimeter^{2}}$ Effect factor of healthy RBC is approximately 0.9 whereas that of sickle cell is smaller than 0.4.
球度（Sphericity）	the closeness between a cell and the perfect sphere. $Sphericity = \frac{Inscribed \, circle \, radious}{Enclosing \, circle \, radious}$
RFactor	$RFactor = \frac{Convex\\_Hull}{\pi\times M}$ $Convex\\_Hull$ represents the smallest polygon with fitted-region.
Solidity	the ratio of area to the convex area of a cell. $Solidity = \frac{Area}{Convex\\_Area}$
說明	特徵提取的主要目標是爲了提取感興趣區域（Region of interests）紋理特徵
經典特徵提取技術	Gabor濾波（Gabor filter）離散小波變換（Discrete wavelet transform, DWT）灰度遊程矩陣（Gray Level Run Length Matrix）線性鑑別分析（Linear Discriminant Analysis, LDA）主成分分析（Principal Component Analysis, PCA）

分類方法
K-Nearest Neighbour (KNN)	- 最簡單的非參數機器學習方法之一 - Instance-based learing technique: 只需本地更新函數
Support Vector Machine (SVM)
Artificial Neural Network (ANN)	- 監督學習方法 - 通過更新權重優化cost function
Self Organising Feature Mapping
Levenberg-Marquardt Algorithm	採用均方差作爲cost function訓練特徵向量
Random Oracle Model (ROM)	- 一種集成分類器 - 由一堆分類器以及隨機預言機發展而來 - 基於隨機預言將訓練數據分爲兩組 - 預測時，應用隨機預言在兩個分類器之間選擇一個分類器，然後用分類器對數據進行分類
Levenberg-Marquardt Neural Network (LEVNN)	- 利用Levenberg-Marquardt (LM) 算法訓練數據 - 基於高斯牛頓法(Gauss-Newton)以及最陡下降法(steepest-descent) - 比高斯牛頓法更穩定，比最陡下降法更快 - 能夠有效地訓練中小尺寸的神經網絡，但是由於求逆矩陣(Matrix inversion)以及雅各比矩陣(Jacobian Matrix)需要大量計算，所以不適合大的神經網絡
Trainable decision Tree Classifier (TREEC)	- 包括生長與修剪階段(Growing and pruning stage) - 生長階段強調依據局部優化條件迭代分割訓練集 - 修剪階段側重限制異常值以及噪聲，能夠解決過擬合問題從而提高準確度 - 修剪階段相比生長階段更快
Random Forest Classifier (RFC)	- 監督學習技術 - 爲訓練集的每一個算機選擇的子組（subgroup）生成一組決策樹（Decision-trees） - 通過中國多決策樹有效地對小粒子進行分類
Functional Link Neural Network (FLNN)	- 不含隱藏層，單層前饋網絡 - 有效地運用於函數近似以及分類目的 - 功能擴展能夠提高輸入向量的維度，因此通過FLNN得到一個超平面（Hyperplane）有更優越的鑑別能力 - 比多層感知機更快、更具可計算效率
Linear Combiner Network (LNN)
Hybrid classifier H1	LEVNN與RFC以及Levenberg Nerual Network結合產生H1模型
Hybrid classifier H2	基於Fischer鑑別分析的Levenberg-Marquardt learning Nerual Network與RFC結合得到H2模型
Extreme learning Machine （ELM）	- 前饋神經網絡 - 能夠限制過擬合問題
對比	ROM用於隨機猜測基準，LEVNN,TREEC以及RFC是非線性比較模型，而LNN是線性比較模型, H1與H2作爲測試模型，H2的性能優於文獻[59]中任何其他分類器 KNN,SVM,ELM分類器都能夠成功將健康紅細胞與鐮刀型紅細胞進行分類 Ensemble-learning（一種整合不同分類器的學習技術）能夠進一步提高分類性能

特徵提取以及分類方法
Deep Convolutional Neural Networks (CNNs)	- 監督學習方法 - 需要大量數據 - 醫學圖像的模式能夠有效地識別以及高精度地分類 - 能夠保留圖像的空間關係，使其在醫學圖像分析領域更加流行
Recurrent Neural Networks (RNNs)	①Jordan Neural Network Classifier (JNNC) ②Elman Neural Network Classifier (ENNC) ③ hybrid Elman-Jordan Neural Network Classifer (EJNNC) 這些RNN模型都能夠準確可靠的分類鐮刀型紅細胞（Sickle Cell） - 監督學習方法 - 需要大量數據

驗證方法
說明	驗證措施（Validation Measure）對於模型定量分析以及找出模型的限制至關重要
A. Image	1) Real Image: 應當預處理以提高圖像質量，應當關注白細胞、血小板以及噪聲的限制 2) Artificial Image: 以人工方式使用計算機代碼形成完美的真實圖像是不可能的 3) Synthetic Image：由許多孤立的細胞組成人工圖像以及合成圖像僅僅用於驗證方法的有效性，絕大多數研究者強調使用真實圖像進行分割和分類
B. Database	ErythrocytesIDB標準數據集：196全景圖像，629張個體細胞圖像（圓形、細長型以及其他形狀）
C. Performance Measure
True Positive (TP)	準確檢測的非健康紅細胞數量
False Positive (FP)	健康紅細胞被錯誤檢測成非健康紅細胞的數量
True Negative (TN)	準確檢測的健康紅細胞數量
False Negative (FN)	非健康紅細胞錯誤地識別成健康紅細胞的數量
1) Sensitivity	即真正類率（True Positive Rate, TPR） $Sensitivity = \frac{TP}{TP+FN}$
2) Specificity	即真負類率（True Negative Rate) $Specificity = \frac{TN}{TN+FP}$
3) Accuracy	$Accuracy = \frac{TP+TN}{TP+TN+FP+FN}$
4) Precision	即正預測值(Positive Predictive Value) $Precision = \frac{TP}{TP+FP}$
5) F1 Score	Sensitivity與Precision的調和平均數（Harmonic Mean） $F1\, Score = \frac{2\times \left(Sensitivity\times Precision\right)}{\left(Sensitivity + Precision\right)}$
6) J Score	即Youdens J statistic $J\, Score = Sensitivity + Specificity - 1$
7) False Positive Rate(FPR)	$FPR = 1 - Specificity$
8) AUC(Area Under the curve)	Recevier Operating Characteristic(ROC)接受者操作特徵曲線： TPR與FPR在不同閾值下的曲線，代表二分類器的正確檢測能力 $AUC \in [0,1] \\\\Ideal: 1$

技術討論
圖示
討論1	- 基於閾值的分割技術常用於預處理階段 - 然而僅僅使用閾值方法極難實現鐮刀型紅細胞疾病的檢測分割任務，因爲其不包含圖像的空間信息 - 閾值方法僅僅取決於像素值，因此對於非均勻像素值以及噪聲特別敏感
討論2	- 許多研究者使用分水嶺算法(Watershed Algorithm)進行分割，然而圓霍夫變換(Circular Hough Transform)、主動輪廓(Active Contour)，特別是水平集方法(Level Set method)性能更優 - 因爲CHT強調圓形邊緣，更適合重疊細胞的分離 - 基於區域的技術，特別是水平集方法，基於輪廓的方法廣泛運用於紅細胞分割任務 - 水平集方法對於輪廓拓撲變化具有魯棒性，能夠有效高準確度地分割重疊圖像
討論3	- 聚類方法例如K-means以及FCM（Fuzzy c-mean）廣泛運用於將紅細胞從背景分離的任務 - 爲了有效分割，圖像預處理是必要的
討論4	- 機器學習與深度學習如今廣泛運用於特徵提取和分類 - KNN、ANN等能夠大幅度提高SCD（Sickle Cell Detection）檢測的性能

A. Performance Comparison
基於人工圖像的對比
基於圓周調整技術的對比 (Circumference Adjustment Technique)	- 文獻[2][8][106]通過圓調整（Circular Adjustment）使用凹點檢測（Concave Point Detection）的方法 - 使用三目標聚類的人工圖像（Artificial Image） - 文獻[8]提出的k-curvature techinique（k-曲率技術）由於不準確的局部最大值可能導致了不正確的檢測，因爲其強調曲率僅僅在一個方向變化，K-曲率彙總檢測到的似是而非的局部最大值導致識別了更多的凹點。 - 文獻[2]中關注k-曲率在水平和垂直方向上的估計，乘以這些曲率的絕對值，然後基於閾值識別凹點，成功移除了假的凹點，因此文獻[2]的性能更高
基於橢圓調整技術的對比 (Ellipse Adjustment Technique)	- 使用而目標聚類以及三目標聚類的人工圖像
基於真實圖像的對比
討論1	- 文獻[7]總使用了Ellipse Fitting橢圓擬合技術，其依據直線分割（Line Segmentation）技術 - 文獻[2]不受輪廓噪聲的影響，保持了其卓越的性能
討論2	- 基於橢圓調整技術
討論3	- 文獻[2]的性能優於文獻[106][7]
討論4	- 文獻[1]的對比
討論5	- CHT更具魯棒性，相比較於分水嶺算法，並且速度更快
討論6：KNN分類器
討論7：CNN	- k折交叉驗證的訓練樣本有重複，所以輸出有可能有或多或少的偏差 - 所以文獻[125]提出的嵌套交叉驗證（Nested Cross Validation）能夠解決這一問題，其更可靠，也能避免過擬合和欠擬合問題 - 粗糙的標籤（5類）的實驗 - 細緻的標籤（8類）的實驗
討論8：其他參考文獻的對比

B. Clinical Uses
1	對於紅歌細胞增強、重塑、分類、分割的研究不斷進步，SCD檢測精度不斷提高且更具魯棒性
2	噪聲、不均勻像素值、重疊紅細胞以及缺少標準數據集，都會影響上述技術的性能
3	然而，沒有方法關注SCD的嚴重程度，即根據SCD疾病的程度進行分類的方法

C. Hardware Implementation
1	檢驗醫學設備的設計需要特變關注技術的高計算複雜度
2	水平集方法需要在實時應用的硬件中實施空間域的並行處理，因爲其需要大量插值計算，但其較之於主動輪廓方法的優點在於能夠應對拓撲變化
3	- 區域生長技術(Region growing Technique)能夠通過並行計算以及共享內存的方法高效實施 - 共享內存能夠是分割更快，因爲其限制了耳聰全局內存中讀取種子點的時間 - 另一方面，應當關注特定區域索取鄰近元素的時間
4	- FCM不適用於實時應用，因爲其高計算複雜度（成員函數基於Euclidean distance，以及大數據集時需要大量時間 - 因此可以使用修改版的FCM優化計算時間以滿足實時應用
5	閾值技術更適用於並行處理，因爲其僅僅關注像素值以及閾值，對內存需求相對較小以及不需要同步
6	- 特徵提取以及分類技術適合於醫學檢測設備的實時應用 - 圖像變換期間，硬件支持插值能夠是系統更加有效。 - KNN簡單依賴於線性計算，更適合於並行處理 - 而ANN需要硬件支持前向網絡 - 近來，深度學習是一種醫學圖像分割分類等實時應用的首選方法
7	混合CNN-SVM分類器使用Zync-Soc-FPGA架構的硬件，其是性價比高的實時系統

A Review of Automated Methods for the Detection of Sickle Cell Disease

工作中用到的腳本合集

24-5-18 X

材料信息學介紹

Radiomics approach for preoperative identification of stages I−II and III−IV of esophageal cancer

Unsupervised Pre-Training of Image Features on Non-Curated Data論文研讀

論文閱讀——利用Inceptioin V3在PET上進行AD預測

A Review of Automated Methods for the Detection of Sickle Cell Disease

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結