【基於深度學習的腦電圖識別】數據集篇:THE TUH EEG CORPUS: A Big Data Resource for Automated EEG Interpretation

數據庫地址:

http://www.nedcdata.org/(似乎要翻牆)

摘要:

這個數據集包括超過 25000 個腦電圖研究,包括一個神經學家對測試的解釋,一個簡短的病人病史和關於病人的人口統計信息,如性別和年齡,是第一次有足夠的數據來支持最先進的機器學習算法的應用;
在這裏插入圖片描述

腦電圖事件被定義爲信號中的臨界點,如與特定疾病的存在相關的尖峯或非對稱波形;

在這篇論文中,作者使用了3762個數據集的會話子集(這是啥?),展示了從原始腦電圖信號數據預測腦電圖的一些基本屬性的初步實驗結果;

在閉環測試中,標準的機器學習方法被證明能夠從簡單的特徵中預測常見的事件,並且具有很高的準確性,在 6 路開放集分類問題上,它的錯誤率低於 50%50\%,而神經科學家認爲只有分類系統的錯誤率在 %5\%5 以下,才能認爲這個系統是可靠的;

因此這是一個很有前途的性能,因爲一個認證的神經科醫生需要幾個星期的時間來解釋患者的 EEG 信號,而現有的機器學習模型還遠未達到商業應用的標準,此類系統的臨牀應用受到限制;
EEG 報告實例

TUH EEG 數據集:

規模:

這是目前最大的 EEG 數據集,包括 25,000 個 EEG 記錄 和 14,000 個病例,是 Temple University Hospital 這個醫院自 2002 年來的總數據集;

採樣:

腦電圖信號採用 Natus Medical Incorporated 公司的 NicoletTM 腦電圖記錄技術記錄,原始信號包括使用16位 A/D 轉換器在 250 Hz 的最低頻率下采樣的 20 至 128 個通道的記錄;

存儲:

使用 NicVue v5.71.4.2530 存儲在 EDF 文件中,其中元數據信息分佈在 24 個包含患者信息和信號狀態的獨特字段中;

醫療記錄編號、姓名、確切的出生日期和研究編號被編輯在標題中,以確保患者的匿名性,而與腦電圖的結果和解釋相關的信息,如性別、年齡、病史和藥物治療被保留(其中 75%75\% 的 EEG 是少於一小時的採樣);

在這裏插入圖片描述

需要注意的是,儘管報告正文也包含類似的信息,根據不同的年份和腦電圖類型,報告有大約六種不同的格式(採樣年份分佈如下);

在這裏插入圖片描述

數據處理:

從這個數據庫的大小來看,腦電圖信號數據需要 1.8T 左右的存儲空間,平均文件大小爲20 Mbytes;

腦電圖信號數據被“修剪”,簡單地說就是腦電圖技術人員識別出記錄中有臨牀價值的部分,然後丟棄其餘部分;

即便如此,數據量仍是驚人的,例如,如果我們將每個數據通道視爲一個獨立的信號,那麼就有超過1B 秒的數據。雖然一開始這可能看起來很龐大,但感興趣的區段相對較少,通常只佔記錄時間的不到 1%1\%;在一個療程中經歷癲癇發作的病人大約有幾百人,當這些會話被患者的病史交叉引用時,即使如此龐大的數據量也顯得微不足道;

基礎實驗:

分類:

研究這些數據的一個重要部分是與神經病學家反覆討論腦電圖事件的定義,這需要對如何手動解釋 EEGs 以及如何將此過程轉換爲算法描述有更深入的理解;

經過幾次迭代之後,作者將重點放在 6 路分類上:

  1. 尖峯和/或銳波(SPSW):癲癇樣瞬變,在癲癇患者中很常見;
  2. 週期性偏側性癲癇樣放電(PLED):腦電圖(EEG)異常,包括重複的尖峯或銳波放電,這些放電在一個半球上呈局竈性或偏側性,並且幾乎在固定的時間間隔內復發;
  3. 廣義週期性癲癇樣放電(GPED):根據放電間隔時間的不同,分爲週期性短間隔瀰漫性放電、週期性長間隔瀰漫性放電和抑制性猝發放電,三相波(瀰漫性和雙額優勢的雙側同步尖峯,典型的週期頻率爲1-2赫茲)也屬於這一類;
  4. 人工噪聲(ARTF):記錄非大腦來源的電活動,如由於設備或環境引起的電活動;
  5. 眨眼(EYEBL):常見的事件,經常被混淆或弄得很混亂;
  6. 背景信號 (BCKG):所有其他的信號;
    在這裏插入圖片描述

分析:

前三個類是信息承載,因爲它們描述的事件對人工解釋EEG至關重要,他們的主要區別是週期性的程度和這些事件跨通道發生的程度;

最後三個類用於改進背景模型;背景建模是任何機器學習系統的重要組成部分,它試圖對信號的時間演化進行建模(例如,隱馬爾可夫模型);

作者試圖讓系統自動執行 背景/非背景 分類作爲建模過程的一部分,而不是使用啓發式預處理算法來檢測感興趣的信號;

人工噪聲和眨眼事件經常發生,它們值得單獨分類;

其餘與前五個類不匹配的事件被集中到背景類中,因此,背景模型是非常重要的;

此外,模型表現的關鍵方面與前三類的敏感性和特異性有關,因爲這些是神經病學家解釋的關鍵;

特徵提取:

作者使用了標準濾波器組/倒譜系數方法對數據進行特徵提取;

目前整個系統對核心特徵集不是特別敏感,只要它們能充分地模擬從大約 0.5 Hz 到 25 Hz 的範圍;

作者使用一個 8 波段濾波器組分析,它被轉換成一個包含 8 個倒譜系數和能量的 9 元特徵向量,後者是使用頻域方法計算的;

建模:

作者在提取特徵的基礎上,爲每個分類訓練了一個標準隱形馬爾可夫模型(HMM);

隱形馬爾可夫模型是一類雙隨機過程,其離散狀態序列被建模爲馬爾可夫鏈,並被廣泛用於時間序列數據的建模;

作者採用期望最大化(EM)算法對模型進行訓練,主動學習方法(active learning approach)用於引導系統從少量數據到更大的子集:

在這裏插入圖片描述

數據準備:

還應該注意的是,數據準備是處理臨牀數據的一個很大的挑戰,這涉及到根據從醫生報告中自動提取的信息將文件聚類到適當的類中;

作者最初使用主動學習的方法,以完全無監督的方式訓練模型,然後讓專家手動標記少量數據;

作者仔細地選擇了 100 個 10 秒的 epoch,其中包含大量 SPSW 類的示例,以及一些 GPED 和 PLED 示例,並使用這些數據來訓練,並且作者也對另外 70 個 10 秒的 epoch 進行註釋,以作爲一個保留的評估集;

處理:

注意,在這些初步的實驗中,每個通道都是獨立處理的;

通過查看跨通道的行爲,可以很容易地識別一些事件,然而在本研究中,作者限制了自己對每個渠道的獨立分析;

因此作者也正在開發第二個機器學習模塊,它將發佈來自所有渠道的過程假設,並相應地對會話進行分類;

該模塊將大大降低誤報率,在下表中,作者給出了基於 HMM 的評估數據系統的混淆矩陣:
在這裏插入圖片描述

可以觀察到,三個主要事件類(SPSW、PLED和GPED)的正確識別率都在 40%40\% 以上,而錯誤識別率也在40%左右;

然而爲了與臨牀應用相關,沒有必要正確地檢測每一個峯值,它只需要足以檢測到這些現象,一個神經科學家就可以迅速判別,因此更需要關注是降低高度的錯誤報警率,從而避免導致需要審查太多的錯誤數據;

爲了正確看待這些結果,作者還將這個模型與 Wulsin 使用深度信念網絡(Deep Belief Networks)[4]的方法進行了比較;

Wulsin 等人使用了由兩位神經病學家手工轉錄的小型臨牀腦電圖專有數據庫,儘管對信號的非尖峯部分建模的方法有所不同,這兩項研究使用了非常相似的分類;

在他們的研究中,使用的性能指標是 FscoreF_{score},即敏感性和特異性的調和平均值:

在這裏插入圖片描述

他們的模型的性能指標達到了 0.476,而作者提出的模型則達到了 0.702;

在這裏插入圖片描述

上圖顯示了假警報和檢測(正確的識別)之間的權衡,可以通過簡單地修改最有可能的類的似然值的閾值來改變曲線上的操作點;

臨牀醫生更喜歡低誤報率,因爲這樣可以減少花在檢查數據上的時間,並提高他們的工作效率;

根據與醫院神經科醫生的討論,作者提出能夠實際應用的目標是三個主要事件類別的檢出率爲95%,誤報率爲5%;

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章