分享

6分 基于随机森林的房颤预测模型

 葛医生_EP日记 2020-03-24
image.png

摘要

image.png

文章主要研究内容是开发了一个针对华人的房颤预测模型,使用的数据量达到682237例,按9:1分为训练集,测试集。使用了 F1 值recall values, ROC , K-fold交叉验证等方法来评估模型的性能。

结果展示

研究的人口学特征展示

image.png

第一张结果,展示研究人群的基线数据。

效果评估

image.png

计算了评估指标在各个数据集中的值。

与其它模型比较

image.png

比较了现开发的基于 Random Forest模型与其它模型的 ROC比较,显然 RF表现出了明显的优越性。

讨论

我个人比较喜欢看着一部分的内容。

主要创新点

[图片上传失败…(image-eff977-1571562023964)]

作者说:其实在这个模型之前已经有其它针对房颤的模型了,然而其它模型都是基于西方人口队列的。而本研究是基于中国人群的模型构建,这样的模型才会更适用于中国人。

文章不足

image.png

这一部分很多文章可能就是一句套话,说这个研究是一个回顾性的分析就完了,看看人家作者怎么写的。

  • 不可避免的混杂因素,叫做 cofounding factors

  • 缺少生活方式等数据作为预测因子

  • 本文是基于回顾性分析 retrospective nature of this study

  • 本文是用于预测临床诊断的房颤,而实际上会低估房颤的发生率,因为有些仅仅有症状,或通过心电图才能发现

  • 由于数据的保密性,没能比较对勾预测模型的性能,看哪个是最好的。

  • 创新点同样也是缺陷,因为数据是对华人的,那应用也只能针对华人

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多