陳浩然 1,3 , 劉夏陽 2 , 王敏 1 , 楊林 1 , 王嘉陽 1,3 , 孫海霞 1 , 段永恒 2 , 吳旭生 2 , 尚麗 2 , 錢慶 1,3 , 和曉峰 2 , 李姣 1,3
  • 1. 中國醫學科學院/北京協和醫學院醫學信息研究所(北京 100020);
  • 2. 深圳市衛生健康發展研究中心和數據管理中心(深圳 518028);
  • 3. 中國醫學科學院 國家人口健康科學數據中心(北京 100730);
導出 下載 收藏 掃碼 引用

目的 總結并探索機器學習模型在不滿足等比例風險假設生存資料中的應用,為大樣本、高維度的非比例風險(non-proportional hazards,NPH)生存資料分析方法提供參考。方法 首先概述了NPH的概念和相關檢驗方法;然后根據相關文獻重點總結歸納了基于機器學習模型的非比例風險生存分析方法的優缺點;最后利用可公開獲取的真實世界臨床數據,對重癥監護室內腦卒中患者30天內的死亡風險進行了關于兩種集成機器學習模型和兩種深度學習模型在非比例風險生存資料中的案例研究。結果 歸納總結了8種使用普遍的基于機器學習模型的非比例風險生存分析方法,分別包括隨機生存森林等5種一般的機器學習模型和3種基于人工神經網絡的深度學習模型(如DeepHit);案例研究結果顯示隨機生存森林模型的表現最好(C-index=0.773,IBS=0.151),基于排列重要性算法發現年齡是影響腦卒中患者死亡風險最重要的特征。結論 精準醫學時代的生存大數據呈現NPH的現象十分普遍,面對更加復雜的生存分析資料和更高的生存分析需求時,可以使用基于機器學習模型的生存分析方法。

引用本文: 陳浩然, 劉夏陽, 王敏, 楊林, 王嘉陽, 孫海霞, 段永恒, 吳旭生, 尚麗, 錢慶, 和曉峰, 李姣. 機器學習模型在非比例風險生存資料中的應用及案例實踐. 中國循證醫學雜志, 2024, 24(9): 1108-1116. doi: 10.7507/1672-2531.202401190 復制

版權信息: ?四川大學華西醫院華西期刊社《中國循證醫學雜志》版權所有,未經授權不得轉載、改編

  • 上一篇

    基于人工智能的臨床輔助決策系統早期臨床評價研究的報告規范(DECIDE-AI)解讀
  • 下一篇

    基于組合優化的機器學習模型預測胃癌術后感染性并發癥的診斷性研究