1100 萬人,這是國家心血管病中心發布的中國冠心病患者的最新數字。冠心病全稱冠狀動脈性心臟病,一般是由于冠狀動脈狹窄、血流不通暢導致出現心肌缺血現象,是一種比較普遍的心血管疾病。 當冠狀動脈較大的分支完全閉塞、形成血栓時,就出現了冠心病最嚴重的后果——心梗。這種急性、持續性的缺血缺氧會引起心肌壞死,可能危及生命而猝死。因此,如果能夠準確地預測心梗的發生,將會挽救很多生命。 近日,荷蘭格羅寧根大學醫學中心(UMCG)的實驗心臟病學研究人員 Luis Eduardo Juarez-Orozco 等人,利用一個基于集成學習 Boost 方法的機器學習模型(LogitBoost),實現了對冠心病人醫療數據的更充分挖掘,在判斷心梗的可能性上,超越了人類醫生。
用什么數據?
醫療 AI 領域所面臨的最大難題就是數據的匱乏。與常規人臉識別、物體識別等計算機視覺領域不同,研究人員無法使用 ImageNet 等現成的大型圖像數據集來訓練他們的模型,必須想辦法組建高清的專業醫療數據集。 對于冠心病而言,這些數據便是 PET(正電子發射斷層顯像)和 CT(電子計算機斷層掃描)心肌顯像結果。PET/CT 是一種權威的輔助診斷方法,利用放射性核素標記的顯影劑,PET 可對人體組織進行造影,CT 則是利用X射線斷層成像。融合利用兩種技術形成的圖像可以安全、無創的實現對病變組織的定位,并快速準確的排查病灶。故一些 PET/CT 指標是冠心病的重要特征。 因此,為了建立能夠判斷冠心病人心梗可能性的模型,Luis Eduardo Juarez-Orozco 等人追蹤了 951 例冠心病人 6 年內的一系列臨床指標和 PET/CT 結果,組建起了冠心病的數據集。
上圖一位患有結節硬化 Hodgkin’s 病的病人的 PET 顯影和 CT 顯影圖。A 為 CT 圖,B 為 PET 顯影圖,C 為 PET 和 CT 共定位圖。這些數據具體包括 CCTA(冠狀動脈 CT 造影)圖像數據所顯示的動脈粥樣硬化區域、血管狹窄百分比、斑塊鈣化程度和 PET 心肌灌注所記錄的每克心肌每分鐘血流量數值。還有抽取自病人病歷的臨床指標,比如性別、年齡、煙史、糖尿病、高血壓、高血脂、家族病史、胸痛、呼吸困難、早期血管重建等記錄。用什么模型和特征?
鑒于數據集規模并不大,研究者選擇利用集成學習的Boost方法提高模型的效率。他們采用十折交叉驗證,建立模型 LogitBoost,對病人是否發生心肌梗死或冠心病致死做出預測,并利用 AUC(Area under Curve Roc,ROC 曲線下面的面積,值越靠近 1,說明二分類模型表現越好)和 ACC(Accuracy,準確率,即正確判斷正樣本和負樣本的概率)指標評估模型結果。 在對前期建立的數據集特征進行層層篩選后,研究人員采取了 85 個特征,既 85 個維度,它們分別來自 10 個臨床指標、58 個 CCTA 指標和 17 個 PET 指標。 為了驗證各個特征的作用,研究人員選擇分批逐步進行訓練與測試。當他們僅利用臨床指標建模時,模型的 AUC 為 0.65,ACC 為 90%。在引入 PET 指標后,模型 AUC 提升至 0.69,ACC 達到 92.5%。再進一步引入 CCTA 數據讓模型 AUC 達到驚人的 0.82,ACC 至 95.4%,遠超人類醫生水平,這是對冠心病人數據的更高效利用,同時這也說明比起醫生僅憑借單純的指標比對,機器學習模型更能綜合利用檢測數據的潛在特征,達到更精準的預測。展望
冠心病作為一種普遍高發的疾病,其危險性不容多說,心梗過世并不罕見,并且很多時候由于沒有明顯癥狀而被人忽略。人工智能用于醫療領域也不是一天兩天,但能夠切實可行、廣泛用于社會、治病救人懸壺濟世,是本模型的優秀之處。充分利用已有的醫療數據,挖掘潛在信息,達到更準確的預測,超越人力,這正是 AI 的初衷。未來的醫療,絕不再會僅靠人類專家。
-
人工智能
+關注
關注
1796文章
47667瀏覽量
240288 -
機器學習
+關注
關注
66文章
8438瀏覽量
133085
原文標題:利用 85 個維度診斷冠心病人心梗可能性,機器學習模型超越人類醫師
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論