Detecting Falls with Wearable Sensors Using Machine Learning Techniques

基於機器學習和可穿戴傳感器的跌倒探測系統

摘要:對於易跌倒人羣來說,跌倒是一個嚴重的公衆的健康問題甚至可能威脅到生命安全。爲此,我和我的團隊開發了一套自動跌倒檢測系統,通過固定在人體六個不同部位的傳感器單元。每一個傳感器單元包括三個三軸設備(加速度傳感器,陀螺儀,磁力計或者說是指南針)。14名志願者實踐了包括20項志願性的跌倒動作和16項日常基本活動,得出2520條數據。爲了降低計算機訓練和測試用例的複雜性,我們關注每個傳感器在加速度峯值點周圍4 s的窗口內每個傳感器的原始數據,然後進行特徵提取和還原。大多數早期的跌倒檢測研究採用基於規則的方法,這些方法依賴於傳感器的輸出簡單的閾值。通過下列六種機器學習技術,我們成功的從一系列的ADL中區分出了跌倒行爲:K-近鄰(K-NN)分類器,最小二乘法(LSM),支持向量機(SVM),貝葉斯決策(BDM),動態時間規整(DTW),和人工神經網絡(ANNs)。通過比較性能和計算複雜性,我們發現K-NN和LSM結果最理想,靈敏度,特異性和精確度都能夠達到99%以上。這些分類方法同時還具有可接受的訓練和測試的計算需求。我們的方法能夠能夠使用在現實場景中,儘管其中的數據長度不確定或包含多種按序記錄的行爲活動。
1、簡介:
隨着世界人口的老齡化,與健康相關的技術和對於老人活動的流動性檢測正在成爲一個熱門的研究領域。科技的急速發展使得移動無線設備成爲人們生活的一部分。情景感知的一個重要方面就在於識別,轉譯,監測人們日常的基本行爲,比如,站立,坐下,躺下,行走,上下樓梯,其中最重要的是,跌倒行爲的監測。世界健康組織講跌倒行爲定義爲不自主的,未預料的,不可控制的導致人體衝向地面的事件。
跌倒行爲需要被當做日常行爲之一,因爲跌倒常常在日常活動中意外的發生。跌倒是健康問題和也是一個健康威脅對於65歲以上的老年人來說。有數據表明,三分之一以上的老年人每年至少跌倒一次。除了老年人,兒童,殘疾人,工人,運動員以及一些病人也常常跌倒。跌倒的原因有很多,而且其中一些不可能完全避免,而跌倒的後果往往很嚴重,所以,跌倒需要可靠的監測來保證減少相關的傷害和健康花費。精準的,可靠的,健壯的跌倒實時探測算法就非常的有必要了。
跌倒探測系統應該避免泄露跌倒危險人羣的隱私,或限制他們的自由或降低其生活質量。用戶激活的跌倒探測系統並不能有太大的實用價值。跌倒探測系統需要完全的自動化,可能需要多種傳感器數據信息來保證其健壯性。一種普遍使用的方法是在環境中固定不同的傳感器,比如攝像頭,聲控設備,壓力傳感器,振動傳感器,紅外傳感器,激光傳感器,RFID標籤,慣性傳感器,方向傳感器 。智能環境能通過多種傳感器成功實現,但這常常意味着高昂的安裝費用。此外,其他人或寵物的移動也會輕易的干擾系統甚至發出錯誤的警報。這種方法的唯一優點就在於跌倒危險人不需要佩戴或攜帶任何的傳感設備。如果人只在一棟建築的特定區域活動,那麼這種方法是可行的。然而,當人們在室內和室外到處活動時,那麼這種方法就不合適了。這種方法使得人們的活動範圍受到侷限,因爲系統僅在特定的環境中才能夠使用。
與大多數基於上述方法的研究相比,可穿戴移動傳感器有一些好處。從傳感器傳回的多個方向的一維信息使得處理更加的簡單並且能夠直接提供所需的三維信息。與視覺動作捕獲系統需要單一視線不同的是,慣性傳感器可以靈活的固定在物體裏邊或者後邊,毫無阻礙。因爲它們很輕,很舒服並且非常易於攜帶,可穿戴傳感器不會把人們限制在一個像錄音棚一樣的環境中而是讓人們能夠自由地在室內外活動。可穿戴傳感器所需的基礎設施和相關花費比智能環境所需的少得多,並且可穿戴傳感器不會侵犯到人們的隱私。不像聲控傳感器,可穿戴傳感器還不會受到噪音的干擾。可穿戴傳感器因而非常的適合開發自動化的跌倒探測系統。在本次研究中,我們依據這種辦法來探究健壯而精確的探測和分類方法從而把跌倒行爲在日常行爲中區分開來。
跌倒探測一直都有人在研究。早期的一些研究工作比較片面而且受限並沒有系統化。由於研究人員之間缺少共同點,使得一些發表的結果難以進行對比,綜合或建立起一種能夠達成結論的方式。傳感器的配置和形式,物體的數量和特徵,考慮的跌倒類型,特徵的提取,以及信號的處理方式在不同的研究中都各不相同。儘管大多數的研究都有調查自主的(模仿性的)跌倒,記錄在論文中的跌倒記錄的數量也非常的有限。後者是一項非常困難且耗時的工作。而少量的真實的來自一部分病人的跌倒事件也不能概括爲大部分的易跌倒人羣的跌倒行爲。
機器學習技術被用來區分包括跌倒在內的六種行爲,通過使用一種紅外動作捕獲系統。支持向量機的研究不斷的在發表。在近來的一項研究中,提出了一個基於計算機視覺的跌倒識別系統,通過把正常的RGB顏色信息和深度匹配起來。而隨着深度地圖的錯誤減少和場景其他信息的補充,這種組合能夠實現更好的結果。跌倒因而能夠以高達95%以上的準確率從日常行爲中識別並區分開來。
爲了實現健壯而可靠的跌倒探測系統同時與不同的研究進行比較,把從標準化的實驗中得到的數據開放出來就顯得很有必要了。我們發現僅僅三項研究提供了跌倒實驗的指導,而只有一項實踐了。而在【23】這篇論文中,說明沒有跌倒行爲的開放數據庫,僅描述了跌倒的行爲數據庫的期望架構和特徵。
儘管確實存在一些關於跌倒探測的商業設備和專利,這些設備並不能讓人滿意。主要的原因就在於這些設備的高僞預警率,高昂的鋪設和維護費用以及反人類工程學的特點。而可穿戴跌倒探測系統廣受詬病的一點則在於人們經常忘記,忽略或者不想佩戴這些設備。而如果這些設備是由電池供電的話,那麼就還需要一次次的更換電池。然而,隨着微型集成傳感器技術的進步,這些設備已經發展的越來越小,越加的舒適和實惠。並且能夠輕鬆地整合到附近其他的可報警系統
或者人們身上攜帶的設備。這些設備的輕便,低能耗以及無線使用降低了對於其可攜帶性和不舒適性的擔憂。此外,包含嵌入式的加速度傳感器的智能手機也是執行跌倒探測系統算法的合適的設備。
通過可穿戴傳感器及機器學習技術,本項研究旨在精準健壯地探測跌倒行爲。除了使用單一的基於規則的僅依賴於傳感器輸出值得算法外,我們還參考了附近加速度點的信號值。爲了能夠獲得足夠數量的數據來根據論文23中的指導 來實踐算法,我們僅把我們的研究建立在自主性的(模仿性的)跌倒行爲之上。
下文按照如下方式組織,在section2,我們描述了數據的獲得和對六種機器學習方法的預覽。在section3,我們在實驗數據的基礎上比較了不同機器學習方法的表現和對機器性能的要求。我們在section4討論了比較的結果,並在section5指明瞭未來研究的方向。
2、材料和方法
2.1數據獲得
我們使用由 Xsens Technologies製造的 MTw Software Development Kit 中的六種MTw傳感器集成單元。每個集成單元包含了三軸設備(加速度傳感,陀螺儀,磁力計即指南針)。我們在志願者開始實驗之前校準了傳感器然後以25HZ的取樣頻率捕獲記錄了原始動作數據。每個單元的加速度,轉速,以及在x,y,z方向上的地球磁場強度都被記錄了下來。測量的數據通過RF連接(ZigBee)到Xsens’ Awinda Station然後通過USB接口連接到一臺電腦上。
2.2、實驗過程
我們根據23這篇論文的指導設計了跌倒行爲實驗。因爲Erciyes University Ethics Committee的鼎力支持,7名女性和7名男性健康志願者參與了我們的實驗。我們將六個緊緊地安裝在特定的帶子上的無線傳感器單元固定到了參與者的頭,胸,腰,右手腕,右大腿和右腳踝部位(圖1)。不像有線系統,無線數據獲取允許使用者更加自然地移動。志願者們佩戴了頭盔,護腕,護膝以及護肘並在一張柔軟的墊子上來演示各種行爲以防受傷。每個行爲軌跡大概平均持續了15s。
14個志願者重複了五次一組包含20個跌到行爲和16個日常行爲的動作。我們因此獲得了包含1400多項跌倒動作和1120項日常行爲動作的數據。許多非跌倒性的動作是一些高衝擊的事件因而可以干擾到跌倒行爲的探測。這麼大的一個數據量對於檢測我們的算法是非常的有用的。
2.3特徵選擇和減少
早期的跌倒探測研究大多使用簡單的傳感器的輸出值,因爲這樣比較簡單而且所需處理時間少。這種方法並不十分健壯和可靠因爲跌倒的類型有很多種,並且它們 的特徵呈現出很大的差異性。此外,相當一部分的日常行爲能夠干擾到對於跌倒行爲的探測。爲了提高健壯性,我們考慮收集的信號的其他特徵。完整的加速度由以下式子得到:

其中Ax,Ay,Az分別是x,y,z三個軸向的加速度。我們首先識別出加速度爲峯值的時間點。然後,我們在峯值前後選取2s的時間間隔,對應着101個取樣點的窗口大小,忽略其他點的值。而其他傳感器的其餘軸向的數據也以相同的方式化簡,考慮從傳感器取得的數據,這樣就有六組101*9個數組的數據了。數據的每一列被表示爲一個N*1的一維向量s= [s 1 ,s 2 ,…,s N ] T,其中N=101.提取出的特徵值包括最小值,最大值和平均值,以及方差,偏度,峯度,前11個值的自相關序列,以及離散傅里葉變換(DFT)的前五個峯值信號與相應的頻率:

其中,DFT q(s)是1-D N點DFT的第i個元素。我們展示了這15120條記錄的各項特徵。前五個分別是:最小值,最大值,平均值,偏度和峯度值。因爲每個集成設備有九個方向,45個特徵值取得。自相關產生99個特徵(9軸×11特徵)。 DFT產生5個頻率和5個幅度值,產生共有90個特徵(9軸×10個值)。 因此,每次試驗從每個傳感器單元中提取234個特徵總共(45 + 99 + 90),導致維度爲1404×1(= 234個特徵×6個傳感器)的特徵向量。
因爲初始的特徵值太大了,而且並非所有的特徵值都能用於從日常行爲中區分出跌倒行爲,爲了簡化訓練和測試分類的計算複雜性,我們根據PCA把特徵值的數量從1404減少到了30並且把結果特徵值轉化爲0~1間的數值。PCA是找到特徵的最佳線性組合的變換,在它們表示特徵子空間中具有最高方差的數據的意義上,不單獨考慮類內和類間方差。特徵值向量的簡化維度取決於
在圖2a中觀察到的排序的1404×1個特徵向量的協方差矩陣按降序排列的特徵值。 最大的30個特徵值構成了本金總方差的72.38%組件,並解釋了數據的大部分可變性。 30個對應於最大的30個特徵值(圖2b)的特徵向量用於形成變換矩陣從而得到30×1的特徵向量。
2.4基於機器學習技術的分類
一個可靠的跌倒探測系統需要設計好的,快速的,有效的和健壯的算法來推測一個跌倒行爲是否發生。算法的表現可以用以下標準來測量:
靈敏度是指系統監測跌倒行爲的能力,對應於監測到的所有跌倒行爲中實際有效的跌倒行爲所佔的比率:

特異性是指當跌倒行爲出現時系統的檢測能力:

精度對應於跌到行爲和非跌倒行爲的正確區分:

這裏,TP(一個跌到行爲發生並且算法正確識別),TN(跌到行爲未發生,算法未識別出跌到行爲),FP(跌倒行爲未發生,但是算法錯誤的識別了),以及FN(一次跌倒行爲發生了,但是算法沒有識別出來)分別表示真實有效的,真實無效的,虛假有效的,以及虛假的無效的跌到行爲探測。顯然,靈敏度和特異性之間的關係時相反的。比如,在一個僅使用簡單輸出值的算法,隨着輸出值的下降,FN的比率隨之下降同時孫發的靈敏度增加。另一方面,隨着FP的比率增加特異性的比率減少。基於這種定義,FP和FN的比率可以由下式得到:

在這篇論文中,我們把跌倒行爲當做日常行爲之一因爲跌倒行爲常常意外地在人們進行日常活動時發生。一個理想的跌倒探測系統應該做到正確的把跌倒行爲從一些干擾性的能夠使人身體部分產生大加速度的日常行爲中區分開來(比如跳躍,或者突然地坐下)。算法必須足夠的健壯,智能並且靈敏且能減小FP和FN的比率。由於ADL的錯誤識別所引起的錯誤報警雖然有害,但是可以由用戶取消。然而,不要把其他行爲識別成跌倒行爲還是非常的重要。表示未識別出的跌到行爲的FN,一定要通過各種辦法儘量避免,因爲如果跌倒行爲造成了身體或者心理上的傷害但是用戶卻不能做到及時處理。比如長時間的靜止(比如跌倒後的暈倒)可能受到睡眠或者休息狀態的干擾。
我們使用了6種機器學習技術來從日常行爲中區分出跌到行爲並且基於器靈敏度,特異性,精度和計算複雜性來評價他們的表現。在訓練和測試中,我們隨機拆分數據集到p = 10個相等的分區,並採用p交叉驗證。我們使用p - 1個分區進行訓練,並保留剩餘的分區用於測試(驗證)。 什麼時候這對於每個分區重複,訓練和驗證分區在p個連續循環中交叉數據集中的每個記錄都有機會進行驗證。
然後是6種機器學習算法

K-近鄰(K-NN)分類器,
k-NN方法基於最近的訓練對象來分類給定的對象[28]。 類決策是通過從所選數量的最近鄰k中進行多數投票而產生的,其中k> 0是k的標準值。這裏k並沒有一個固定的值,因爲k-NN算法對本地數據結構敏感。 越小的k值增加方差並使結果不穩定,而較大的k值增加偏差但降低靈敏度。 因此,k的正確選擇取決於特定的數據集。 在這項研究中,我們基於我們的數據集確定k的實驗值爲k = 7。

最小二乘法(LSM),
在最小二乘法中,兩個平均參考向量分別對應於跌到行爲和日常行爲。 將給定的測試向量x = [x 1,…,x M] T與每個參考向量進行比較r i = [r i1,…,r iM] T,i = 1,2,通過計算它們之間的平方差的和:

這種分類決策取決於最小的上式的值。

支持向量機(SVM),
初始的係數集和內核模型影響SVM的分類結果。 訓練數據(x j,l j),j = 1,…,J的長度爲J,其中x j∈IR N,類標籤爲l j∈{1,對於兩個類(fall和ADL)。 我們使用徑向基核函數K(x,x j)= e-γ| x-x j |如圖2所示,其中γ= 0.2,具有用於SVM的庫,在MATLAB環境中稱爲LIBSVM工具箱[29]。

貝葉斯決策(BDM),
BDM是統計模式分類中一種強大且廣泛使用的方法。 我們使用正常BDM中的似然的密度判別函數,其中參數是平均數μ和每個類的訓練向量的協方差矩陣C. 這些是基於訓練計算的兩個類的記錄並且對於每個摺疊是恆定的。 給定的測試向量x被分配給該類,其較大的可能性計算如下[28]:

動態時間規整(DTW),
DTW提供了可以在時間上變化的兩個時間序列之間的相似性的度量速度[30]。 序列在時間上非線性地翹曲以找到之間的最小成本變形路徑測試向量和存儲的參考向量。 通常,歐幾里得距離被用作成本測量和參考向量的元素之間的測量。 DTW用於諸如此類的應用中作爲自動語音識別來處理不同的講話速度,簽名和步態識別,ECG信號分類,指紋驗證,手寫歷史文檔中的單詞識別電子媒體和機器印刷文檔,以及彩色圖像中的面部定位。 這裏,DTW用於區分從運動傳感器中信號中提取出的不同活動的特徵向量。

人工神經網絡(ANNs)
ANN包括一系列的通過加權吸收連接數據的獨立處理單元[31]。 我們實現了一個三層ANN,每一輸入層和包括30個神經元,每一個輸出層包括一個單一的神經元。 在隱藏層中,我們使用虛擬激活函數。在輸出神經元,我們使用purelin線性激活函數,這使得類決策根據規則:

我們在MATLAB環境中使用神經網絡工具箱創建了ANN並對其用Levenberg-Marquardt算法進行了訓練。
3.結果
本項研究的框架是與實體無關的,我們考慮的分類器是用來處理完整的數據集的,而不是對每個實體都設計不同的分類器。我們在表2中把6種分類器的比較結果展現出來了。k-NN分類具有最高的精度(99.91%),其次是最小二乘法,SVM,BDM,DTW,和ANN。其中k-NN具有100%的靈敏度,表明所有的跌倒行爲都被檢測出來了。然而,有2~3個日常行爲被錯誤的識別了,在10趟2520條軌跡當中(表3)。平均精度和分類器的標準偏差在表三中體現,在表三中,我們觀察了每個回合的相似性,表明其重複性。因爲k-NN分類器和最小二乘法沒有錯過任何跌到行爲,我們認爲這兩種算法都是可靠的算法。分類器的ROC曲線如圖3所示。
我們在表2的最後兩行中的比較了六種機器學習技術的對計算性能的要求,就數據集的單次數據集包含252個特徵向量所需的訓練和測試時間。 我們在具有2.67 GHz四核64位Intel Core i5處理器和4 GB RAM的Windows 7計算機中的MATLAB 7.7.0環境中實現了算法。在所需的訓練時間方面,分類器以遞增的順序分別爲BDM,LSM,DTW,k-NN,SVM,和ANN。 在測試時間方面,順序爲ANN,SVM,LSM,BDM,k-NN,和DTW。
4.討論
開放的數據集允許研究者把自己的結果與之進行比較。個體的差異性,活動譜,以及實驗的數量是影響數據的重要因素。當一系列的活動能夠很輕易的從少量個體中區分開是,那麼就很可能獲得較高的精度。然而,這些效果可能不能維持當有新的活動或者個體參與到研究當中時。儘管一些研究存在較高的敏感性和特異性,這些算法當真正在現實世界由新的使用者實現時,它們的表現就不那麼好了。現在有很多的令人滿意的學術成果,但是市場上並沒有可靠的成型的產品。
我們在本研究中記錄幷包括在我們的數據集中的ADL是真實世界ADL的一個子集,其中許多是高度影響的事件,可能很容易與跌倒混淆。 自實驗室記錄ADL /瀑布和那些發生在自然環境中可能有一些差異,我們比較了平均值和我們記錄的自願下降的峯值加速度值,與[17]中的那些,其中一些記錄老年人的非自願跌落。 圖4示出了由腰部記錄的樣本信號傳感器在我們的實驗中(這也是傳感器在[17]中的位置)。
5.結論
我們使用以前提出的,標準化的實驗程序,用基於機器學習的方法實現了六種分類器來把區分跌倒行爲和其他行爲。我們比較了基於實現精度高於95%相同的數據集的各種機器學習技術的性能和計算要求。十多次實驗中結果的良好的重複性表明分類器的健壯性。k-NN算法和最小二乘法沒有遺失任何的跌倒行爲,因此我們認爲這兩種方法是可靠的分類器算法。這些分類器在訓練和測試時同時具有良好的可接受的對計算性能的要求,使得他它們更加的適合實際的實時的應用。我們使用標準化的程序來執行一組全面的跌倒探測實驗的事實在跌倒探測的領域樹立了一個良好的範例。這也使得我們的方法更加的接近現實生活中的場景,其中帶有不確定長度的,包含多種有序活動的數據被記錄了下來。我們計劃使用從跌倒行爲和日常行爲中的數據來測試我們的系統。爲了便於不同研究的算法間的比較,我們打算把我們的數據集公開在爾灣大學機器學習存儲庫[35]。 我們的日常和體育活動數據集已經在同一網站[36]。在我們目前的工作中,我們正在研究六個運動傳感器單元中和這些軸中哪個傳感器在活動和跌倒檢測中最有用[37]。 納入來自生物醫學的信息生命體徵和音頻傳感器的傳感器可以進一步提高我們的跌倒檢測系統的魯棒性。我們正在進行的工作考慮將跌倒檢測算法嵌入移動設備(例如,智能電話)穿在腰部水平附近。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章