多視圖CAD檢測系統乳腺X線攝影基於案例的檢測性能優化

多視圖CAD檢測系統乳腺X線攝影基於案例的檢測性能優化

介紹

通常乳腺腫塊的檢測基於雙視圖乳腺攝影,醫生在閱片是會將所有可用視圖的信息組合在一起,他們比較MLO和CC視圖,尋找不對稱性並評估相對於先前乳房X線照片的變化(放射科醫生比較兩個同側乳房X線照片視圖,以決定是否存在可疑病變。),如果一個視圖中的可疑區域具有與另一視圖中的可疑區域相同的某些特徵,則該區域是真實病變的概率較高(和單視圖雙側乳腺腫塊的檢測不一樣),出了可以檢測是否是腫塊,還可以檢測異常(因爲異常可以通過重疊腺體組織在一個投影中(部分地)模糊。)。通常,基於相對於乳頭的位置和區域相似性(進行視圖的配準),使用監督分類來計算一對乳腺中對應於相同的真陽性區域(TP)的可能性。本研究的目的是使用擴展的連接方法來匹配MLO和CC視圖中的相應區域,以提高我們的單視圖CAD系統的質量檢測性能。具體來說,我們調查多視點分析如何更有效地提高基於案例的性能。爲此,我們使用來自我們的鏈接方法的類概率包含對應特徵來研究CAD系統的學習規則的修改。之前的CAD系統可以發現CC和MLO之間的對應關係,但是基於病例的效果沒有改善。提出基於病例的檢測方法。致力於腫塊檢測和結構失真的檢測。

評估方法

FROC

特色

Bootstrappingwas used for statistical analysis.

統計分析中用了自學習的方式

備註

1.論文[1] - [3]研究了MLO和CC視圖中相應區域的匹配

2.一旦計算了區域對應分數,就可以融合來自兩個視圖的信息。[4]提出了對每個圖像內的單視圖和對應分數進行排序,並隨後對其進行平均。

3. 在正常情況下,排名方案將不會工作得很好,因爲在正常情況下分配高排名將導致許多強烈的假陽性。 最近的研究涉及基於相似特徵和神經網絡[5],[6]和貝葉斯網絡[7]的融合方案。 在這些研究中,獲得了基於病變的檢測性能的顯着改善,而基於病例的性能保持相似。

4. 在這些研究中,獲得了基於病變的檢測性能的顯着改善,而基於病例的性能保持相似。

基於病變和基於病例的檢測性能的區別

5. 如果CAD在兩個視圖中檢測到區域,則可能有一些益處,因爲研究表明如果在兩個視圖中標記區域,則讀者更可能對CAD提示進行操作。

這推動鄭等人 [8]開發一個多視點CAD系統,旨在保持相同的基於病例的敏感度水平,同時增加在同側視圖上檢測的質量數。 發現多視點方法將假陽性(FP)檢測率降低了23.7%,同時保持了基於病例的檢測靈敏度爲74.4%。

6. 在本研究中,我們使用單視圖檢測方案,包括以下階段:分割和預處理,可疑圖像位置的初始檢測,區域分割和最終單視圖分類(圖1)。 這些步驟已在先前的出版物[9] - [11]中詳細描述。

7. 作爲檢測方案的第一步,乳房X線照片被分割成乳房組織,胸肌(如果圖像是MLO視圖)和背景區域。 背景像素通過使用閾值結合形態算子序列來分類[12]。 隨後,胸部肌肉以兩個步驟從乳房區域分割。第一種方法是基於使用改進的霍夫變換的直線估計,如Karssemeijer[12]所述。 然而,胸肌的邊界通常略微彎曲。

因此,在第二步驟中,通過使用動態規劃方法的初始估計附近的最佳路徑搜索更精確地確定邊界。

在這些步驟之後,應用厚度均衡算法來增強乳房的周邊[13]。

8. 相同的算法用於識別徑向梯度向量的模式,而不是徑向刺孔,在質量損傷的中心區域產生高響應。

9. 軟組織例如乳房的大的非線性變形使得配準極其困難。

10. 基於電弧的方法基於這樣的想法,乳頭和病變之間的距離在乳房壓迫期間保持相當恆定,

這可以通過乳房X射線攝影術者從胸壁拉出乳房以便最佳定位的事實來解釋。

總結

在之前的研究中發現,考慮CC和MLO之間的相關性可以提高病變的檢測效率。然後給予病例水平的檢測性能並沒有提高,本文提出了一種基於案例的雙視圖結合的乳腺腫塊檢測方法。先設計單視圖病變檢測系統以及對應的分類器,然後針對不同的區域對和相關特徵提出了可能的分類。對應的分類器的輸出作爲多視圖CAD系統的輸入模式的偏置選擇。(說白了就是輸入)。本方法用於檢測惡性腫塊和結構失真。實驗中所使用的乳腺X線攝影圖片包括4個視圖,至少有一個視圖包含惡性病變區域。

由於較高的假陽率,CAD系統的檢測性能不及人工。

雙側視圖結合降低假陽率的原因

1.放射科專家在閱片的時候會參考儘可能多的視圖,他們在同側MLO和CC視圖中,(尋找不對稱性以及和評估相對於先前圖片的一些變化。)查找可以腫塊。

2.如果兩個視圖中的可疑區域具有相同的某些特徵,則該區域是真實病變的概率較高。

3.雙視圖還提高了檢測異常的機會,因爲在一個投影中異常通過與腺體組織重疊(部分地)模糊,但是在另外一個視圖中會看的比較清晰,這樣對比檢測出異常。

4.雙視圖的結合使得那些由於正常乳腺組織的重疊而看起來像是可疑腫塊的區域也可以識別出來,從而降低了假陽率。

有很多研究者進行了身體同側雙視圖結合的乳腺腫塊檢測的研究, 首要的是單側視圖檢測到的可疑腫塊區域的匹配。論文[1]-[3]對MLO和CC相關區域的匹配進行了研究(而不是整個視圖的匹配)

通常,基於相對於乳頭的位置區域相似性(牽涉到這兩方面的計算),使用監督分類來計算一對中的區域對應於相同的真陽性(TP)區域的可能性。 一旦計算了區域對應分數(需要計算的值),就可以融合來自兩個視圖的信息。

在臨牀實踐中基於病例的敏感性更有意義,即在單視圖或者雙視圖中檢測病變。基於病例的檢測比基於腫塊的檢測難的原因。

如果跟一側腫塊配對另一個是圖中是一個更加明顯的病變,那麼該區域是可以病變的可能性增加。實際上在匹配對中更明顯的真陽率幾乎不受另外一個投影中的輪廓的影響。意思是在一個匹配對中,如果他的真陽率比較高,那麼就不會手另外一個視圖的影響,如果說真陽率相對另外一個視圖比較低的話就會受另一真陽率比較高的視圖的影響而有更大的可能性成爲真陽。(小受影響,大不受影響)

(在這裏真陽指的就是腫塊,假陽就指的是正常的組織),真陽對假陽那麼它是腫塊的可能性會降低。

雖然說對應分類器的性能已經足夠高,但是多視圖分析仍然能夠提高病例分析的敏感度。

和真陽不同,假陽在另外一個視圖中沒有相匹配的區域。

研究的目的是使用擴展連接方法實現MLO和CC圖像中對應區域的匹配,並修改了CAD系統 1)在我們的連接方法後使用類概率2)在CAD系統中包對應特徵

初步

單視圖檢測方案包含一下幾步:

分割以及預處理

目的:

分割爲乳腺組織,

胸肌:兩步:1)使用廣義霍夫變換進行直線檢測,所得到的胸壁邊緣有些彎曲,2)動態規劃方法在原始估計路徑上進行最優路徑搜索。在這些步驟之後,應用厚度均衡算法來增強乳房的邊緣。在MLO圖像中使用類似的算法來均衡胸肌中的背景強度,以便於檢測位於胸部邊界上或附近的腫塊。

背景:閾值分割+形態學操作

乳頭的定位

通過假設乳頭是皮膚輪廓上到CC視圖胸部或到MLO視圖胸肌最大距離的點來估計如同樣的位置,之前的研究表明,通過這種方式所確定的乳頭的位置與實際乳頭位置接近(平均誤差=12.94mm)[15]感覺這個誤差還是挺大的可以考慮改進。

可疑圖像位置的初始化檢測(單視圖中腫塊區域的檢測)

基於直線基於弧線的在另外一個視圖中進行對應區域的匹配

在初始檢測階段,會確定很多的候選位置,在定位的地方會給模式的一些屬性,這與後續分類息息相關。

在圖像中以1.6mm的間隔進行採樣,每個位置提取5個特徵(檢測刺孔存在和腫塊)。

對於星狀圖案的檢測,使用多尺度技術基於乳腺攝影圖像中的紋理取向的圖的統計分析,通過使用對直線的徑向圖案敏感的算子來獲取紋理圖。使用相同的算法去識別模式中的徑向梯度向量而不是徑向刺孔,在腫塊病變的中心區域產生高的響。(計算梯度向量,在響應高的地方可以認爲是腫塊區域)

5個相似神經網絡,隨機初始化,在獨立的小測試集上進行訓練,使用這些特徵對規則網格上的像素進行分類。5個神經網絡的平均輸出結果表示了腫塊存在以及結構失真的的可能性。似然圖的局部最大值超過閾值認爲是候選者的位置,通過這種方式得到很多可進一步研究的感興趣的候選者。閾值固定,初始位置的數目隨圖像的改變而改變。選擇一個比較低的閾值來防止一些微弱的真陽的丟失,但是這使得假陽候選位置數目增多,在我們的圖像中每幅圖像平均取20個候選位置。

區域分割

第二步,在上一步中所得到的局部極大值作爲區域分割的種子點,我們採用了一種極性重採樣和動態規劃的方法,在兩種方法在之前的研究中相對於其它的方法性能更優。計算區域特徵來表示區域屬性,比如區域對比度、邊界粗糙度、線性紋理、在乳腺中的相對位置、輪廓光滑度、腫塊大小以及其它區域特徵。除了這些,在初始檢測階段的5箇中心腫塊、刺狀特徵、初始檢測階段的腫塊似然分數也用於單視圖區域的分類。

在另外一個視圖確定了位置後獲取對應的區域(點到區域的獲取)

單視圖分類

特徵提取:提取雙視圖對應的匹配位置的特徵,作爲分類器的輸入

分類器設計

研究中所使用的神經網絡:一個隱含層、只有一個輸出節點的輸出層。在初始像素分類階段的隱含節點的數目是5,在分類階段使用了12個隱含節點,使用反向傳播算法、sigmoid激活函數,病變模式映射爲接近1的值,正常模式映射爲接近0的值。在訓練之前,數據要歸一化爲0均值單位方差。爲了避免過度訓練,使用獨立停止集自適應地確定訓練迭代次數。

方法實現

同側視圖區域匹配

x線攝影中,乳腺被壓縮,以減少施加給乳腺的X線劑量,所以很難將MLO中潛在的乳腺腫塊的位置與CC中對應位置相關聯。像乳腺這樣,軟組織大的非線性的變形使得配準更加困難,所以大多數的匹配方法都是基於一系列的標記,如乳頭的位置以及胸肌邊界上的點。對病變進行三角測量主要有兩種方法:基於弧線和基於直線。

基於弧線的匹配方法

思想原型:由於乳房X射線攝影術者從胸壁拉出乳房以進行最佳定位,所以可以認爲乳頭和病變之間的距離在乳房壓迫期間保持相當恆定。

具體實現:爲了實現腫塊可疑區域和另一視圖對應區域的配準,計算乳頭到腫塊區域中心的距離,在身體同側(另一)視圖中到乳頭的相同距離定義一個弧線,在這個弧的周圍定義一個具有特定寬度的搜索區域。(在這個區域中搜索對應的匹配位置)

基於直線的匹配方法

思想原型:一般認爲(這就是一個常識問題了),胸壁支撐着乳腺壓縮過程中的變形,使得乳腺中的點向下向前有相同的位移。

具體實現:與CC視圖中的胸壁或者是與MLO視圖中的胸肌平行定義一條直線,在這種方法中,兩個視圖中的乳頭和胸壁都要檢測出來。CC視圖中的胸壁已經描繪出來了,所以認爲胸壁與圖像邊緣平行。MLO視圖中的胸肌在CAD系統中使用霍夫變化的方法自動地檢測出來。

匹配:一個視圖中的可疑腫塊區域與另外一個視圖中的對應區域

計算乳頭和投影到中心線上的腫塊中心的距離,中心線是垂直於胸壁過乳頭的直線。這個投影距離被映射到另一視圖的中心線上,然後就定義了一個和胸壁平行的直線。(這個直線就是接下來用於定位的?),潛在對應區域到這條直線的距離作爲特徵去匹配區域。(根據相應的距離完成定位,那問題就是如何獲取腫塊的中心(區域是規則圖像的中心比較容易獲取),以前距離的測量時基於像素數目,但是這裏是基於絕對距離的。

獲取最優搜索寬度的方法,改變搜索區域的寬度,確定在對應視圖搜索範圍內確定病變的百分比(對於單對圖片,就是對應病變區域在或者不在,對於424幅圖像,就是在一不在的百分比了)

基於弧線的搜索寬度

搜索寬度爲48以確保所有對都能匹配。乳腺區域和在兩個視圖中乳頭和病變之間的徑向距離的絕對差異具有相關性,我們使得搜索區域寬度獨立於乳腺區域,搜索區域寬度爲40-48,這減少了假陽候選區域的數目

基於直線的搜索寬度

需要的搜索寬度更小爲37

相似性特徵的計算

定義對壓縮和位置不敏感的特徵向量,定義的相似性特徵有:

距離差:基於弧線的距離d爲乳頭到 病變的距離,對於基於直線的距離爲病變到直線的距離,w爲搜索區域的寬度。

像素相關性:在之前的區域匹配中用到了成功地應用了像素相關性,在這裏也用這種方法實現CC和MLO對應區域的匹配,雖然由於兩個投影視圖中存在角度的旋轉而是這種方法顯得幼稚。(雖然這種方法幼稚,但是在之前的研究中成功地使用,此處也用這種方法)

極座標空間中最大像素方向相關性:在MLO和CC視圖中找到相應區域 in MLO and CC views的問題不同於找到暫時對中的對應區域 in temporal pairs,,因爲乳房在不同程度上和在不同方向上被壓縮和變形。爲了減小像素相關性差異的影響(暫時對中的相關性低,而身體同側雙視圖的相關性高,爲了使用人家研究的像素相關性,需要減少CCMLO的相關性),對相關度量進行了修改。首先,將區域腫塊的中心作爲中心對每個區域進行極座標變換(極座標變換需要一箇中心?),在轉換後的區域計算Pearson相關係數,使用這個區域的固定直徑D,以及CC相對於MLO的a角度旋轉。所有角度的最大像素方向相關性MPCP作爲一個特徵。

熵:平均信息量,量化圖像紋理的光滑度,兩個視圖對應區域的熵的絕對差異作爲不相似性的度量

直方圖的相關性:直方圖可作爲相似性的度量,但是由於圖像採集的不同嚴重影響了它的值,爲了消除採集參數不同而帶來的影響,我們採用了非參數的直方圖匹配。在每個視圖中以腫塊區域的中心爲圓心定義一個半徑爲2.5mm的圓,在每個區域中可以獲得累計分佈函數,由目標區域的累計分佈函數到原區域的累計分佈函數確定一個灰度變換關係(直方圖規定化),然後把這個變換關係應用於目標函數,從而減小由於曝光和壓縮所帶來的影響,分割區域的直方圖仍然不同,由於真陽的直徑大約爲1.5cm,比我們應用於直方圖匹配的圓形區域要大。計算雙直方圖相關特徵DHC(dual histogram correlation),爲了計算DHC,使用兩個模板獲得兩個區域的兩個灰度直方圖。

腫塊似然性:單側CAD系統的輸出代表了一個區域的腫塊似然性,由此衍生出三個特徵:MLO視圖的腫塊似然性、在CC候選區域的腫塊似然性、兩個視圖中似然性的絕對差異(其值較小時,兩個區域描繪了相同病變的可能性更高)

緊緻性差異:緊湊性表示對象的邊界相對於其面積的粗糙度。

線性紋理差異:代表了在分割區域內線性結構的存在,使用這個特徵是因爲,正常組織相和腫塊組織的紋理特徵不同,所以使用這個特徵的差異作爲兩個對應區域的相似性度量.

用KNN將單視圖分類結果的組合分爲四類,他們分別爲TP-TP\TP-FP\FP-TP\FP-FP,定義對應分數作爲組合區域代表了兩個真陽的似然性。通過實驗將k設定爲27,之所以k值設置的比較大是因爲我們使用k-NN分類器進行後驗概率估計而不是硬分類.單視圖CAD系統檢測到的候選區域和同側視圖區域通過最大的對應分數實現連接。所以區域和最有可能候選的區域之間的映射不是一一對應的,這在我們的方法中並不是一個缺點,我們致力於使用與其他視圖的相關性來評估各個區域的可能性,其他視圖的信息作爲附加的信息源,而不是在區域對分類的時候尋找對稱的解。

雙視圖分類

在應用了匹配算法後,用一個新的模型對在單側視圖檢測到的所有區域進行進一步的處理,此時會添加來自另外一個視圖的附加信息。爲了達到這個目的,訓練一個新的神經網絡,它們作爲單視圖分類器具有相似的配置。來自單側CAD系統的。使用單側CAD系統的選擇特徵以及代表同側視圖匹配區域對應性的相似性特徵作爲輸入。除此之外,由連接算法計算出來的四個分類的可能性也作爲特徵,這樣會得到83維的特徵向量。雙視圖分類對每個區域會產生一個新的可疑率,而不是區域對的聯合比率(先是進行簡單的特徵提取然後進行分類,然後再用似然分數進行相應的匹配,最後再添加一些與匹配先關的一些額外的信息,將這些新的特徵作爲輸入,再得到單側視圖的一個分類的結果,本質上就是在原始單側特徵上添加了一些匹配區域的一個特徵作爲聯合特徵進行分類)

在一些案例中有些區域沒有對應的匹配區域,因爲在同側視圖中沒有潛在的候選者區域(因爲兩個對應區域的相似性太低),因爲對應分數需要超過一個閾值使得區域去匹配。如果沒有找到匹配區域,我們可以使用單視圖分類器的輸出作爲那個區域的可能性,但是這個這個忽略了沒有找到匹配區域本身給了腫塊可以性的一些一種信息。放射科專家沒有在兩個視圖中觀察到病變,這個影響到解釋和決策,解釋沒有觀察到病變的可能情況是一個複雜的過程。在緻密組織中,病變被腺體組織吸收(在這裏可以意譯成遮擋嗎)是很常見的現象,爲了能夠處理雙視圖中的所有區域,我們使用下面的方法。當無法建立一個區域的對應區域時,1)將那個區域的相似性特徵設置爲0, 2)將那個區域是TP-TP連接的可能性設置爲0,3)其他三個類的可能性設置爲1/3,通過這種方式在訓練階段測試階段用雙視圖分類器來處理沒有連接的區域。

爲了選擇雙視圖分類器的特徵,我們使用了順序浮動前向選擇算法。

我們選擇特徵、評估雙視圖分類器的交叉驗證程序在評估模塊。

(這一小節主要說明了特徵擴展的具體實現,雙視圖分類結果的輸入和輸出,沒有對應匹配的區域的處理方法,在進行了這些基礎的匹配、特徵、分類器的設計和實現後,就可以實現基於案例的學習了)

基於案例的學習

應用雙視圖分類器的思想是因爲當一個區域和另一個視圖中的候選區域有相同的特徵時,它的可疑性會增加。(兩側的相似性越大,在該視圖中的腫塊的可疑性越大),這個實際中乳腺X線攝影的閱片實踐相似:放射科專家通過比較兩個視圖來判斷是否有病變。在兩個視圖中都觀察到了病變,那麼癌症的可能性會增加。因爲沒有相似的可疑區域而在另一視圖中找到的假陽將會有比較低的惡性分數。(惡性分數應該是一個獨立的值,說明了真陽的可能性大小。),這是我們在雙視圖分析中想要去模擬的效果。然而應用了雙視圖分析後對真陽區域TP-FP的連接將產生一個比較低的惡性分數。以前研究顯示這種消極影響(這應該是一種意料之中所出現的結果,爲什麼會說是消極影響)消除了雙視圖分類器對連接到另一視圖正確區域的真陽區域產生的積極影響

爲了提高基於案例水平的檢測性能,提出了使用在訓練雙視圖分類器的過程中的對應信息提出了一種方法。在這個研究中我們提出了一個和之前雙視圖分類器有相同配置的神經網絡,但是使用對應信息自適應學習過程的修改學習策略。提出這個方法是是爲了在訓練階段排除那些與另一視圖候選區域相比有惡性跡象微弱的真陽。(兩個都是真陽,但是排除相對比較低的那個真陽),這樣分類器可以致力於檢測雙側視圖中至少一個視圖,而不是雙側視圖。我們期望使用這種方法,可能以基於病變的性能爲代價,基於病例的性能將增加。我們使用兩個閾值去決定在訓練階段一個病變是否要被排除。一個是最大惡性,一個是兩個真陽的惡性分數的最小差異。

實驗和結果

材料

病變乳腺X線攝影:454個病例(1816張圖片),63例是篩查檢測或間隔癌症(252圖像)的先前檢查。

正常乳腺X線攝影:483個病例(1932張圖片)

數據集的嚴謹性:正常的乳腺照片被證實在檢測之後兩年內都沒有癌症;所有病變案例至少在一個視圖中有可視化腫塊或者是結構失真(這個結構失真是怎麼檢測出來),也被病例學證實是惡性的;對於一些病人,之前的檢測也可用。這些在研究中作爲獨立的案例(就是不考慮之間的聯繫,僅是把它作爲獨立的案例去看待)。使用Lumisys 85掃描儀將406例數字化,用Canon CFS300掃描儀將531例數字化。 所有乳房X線照片以50微米像素分辨率數字化,並平均下降至200微米分辨率,同時保持12位的灰度值深度。惡性腫塊在經驗豐富的放射科醫生監督下由,研究人員註釋。這些註釋被用作參考標準。初始分類器集由一個小的獨立數據集(302幅圖像)來訓練。

評價

FROC和5重交叉驗證檢測性能

不引入偏置的數據集建立方法

在交叉驗證之後將五個測試數據集的所有區域的惡性分數彙集到一起,計算兩種類型的FROC曲線,基於病變(檢測到的病變的數目除以總的病變的數目)的和基於案例(在至少一個視圖中檢測到真陽就認爲是一個真陽,最後就是檢測到真陽的案例除以總真陽案例)的曲線。如果CAD區域的中心在註釋區域裏就認爲該區域是真陽。爲了得到單個性能評價,計算平均真陽分數。(MTPF)

使用輔助方式確定單視圖和雙視圖分類器檢測性能的統計顯著性

使用兩種方式獲得的惡性分數計算FROC,然後計算MTPF的差異。

之前進行匹配的時候不一定是一對一的,視圖的區域在另外一個視圖中最多的8個候選區域,最後會設置參數,取似然值大於0.5的連接

 

乳頭的定位已經有比較好的算法,雙視圖聯立的重點在對應區域的匹配。

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章