分享

SCI!基于机器学习的预测模型开发及验证是怎样的?

 葛医生_EP日记 2024-02-20 发布于广西

进入本期内容之前,为我们的小平台做个小推广:

公众号已有约2 0000名读者朋友关注,我们立足于发展护理科研事业,但不局限于护理,如果您对机器学习和深度学习感兴趣,甚至想把它应用于护理或临床科研,请关注护理统计随笔并设置为星标,我们会长期致力于做好对机器学习和深度学习等相关内容的分享,当然还有循证医学、心理测量及各种科研软件甚至编程语言的使用等等。在这里,可以接触到大量您之前未做过或未听过的内容,因此希望可以帮忙转发(纯自愿)。此外,欢迎加入交流群,与我们一起学习。


在这个数字化时代,基于机器学习的预测模型已经成为解锁未来的一把魔法钥匙。它们如何能够预测股市走势、天气变化,甚至是你下一次在线购物的选择?机器学习越来越火爆!浪越大,鱼越贵!在分享本期的文献前,我们有必要了解下机器学习的常见类型。

1.监督学习(Supervised Learning):在训练过程中,模型通过使用带有标签的输入数据来学习,即输入数据和相应的输出标签一一对应。

2.无监督学习(Unsupervised Learning):模型在训练过程中使用没有标签的数据,目标是发现数据中的结构和模式。

3.半监督学习(Semi-Supervised Learning):这是监督学习和无监督学习的结合,其中模型使用部分带有标签的数据和大量没有标签的数据进行训练。

4.强化学习(Reinforcement Learning):模型通过与环境的互动学习,通过尝试最大化某种奖励信号来做出决策。

5.自监督学习(Self-Supervised Learning):模型从输入数据中学习,但不需要外部标签。相反,它根据输入数据中的某种内部结构或信息来自我监督。

6.迁移学习(Transfer Learning):模型在解决一个任务上学到的知识被迁移到解决另一个相关任务上,从而提高模型的性能。

笔者在有限的阅读量内,发现我们护理这一块主要也只是做到了监督学习在预测模型的应用,也有小部分文献使用了Apriori关联规则学习(无监督学习的一种)。其实,预测模型看多了,笔者也在思考一个问题:我们卷数据、卷方法的目的到底是为了什么?说句实在话,没合理的答案,大概这个问题太哲学!如果问题暂时没有答案,那就先学着呗!

本期,笔者解剖的是泰国学者发表在BMC上的预测模型文献!这篇文章很赏心悦目!   

图片

1.摘要

从摘要我们得知作者基于回顾性的资料,采用7种机器学习的方法进行训练和内部验证,总体的评价指标不错,而随机森林构建的预测模型无疑是相对较好的。这篇文章也进行了注册,同时模型也有可视化呈现(web application)。

图片

2.模型可视化呈现

作者也对该模型做了可视化(应用程序),并进行了免责声明,这是非常聪明的做法!做预测模型的读者们,如果将模型进行可视化的话,何不学一下!

图片

3.关键词

归纳性非常好的关键词

图片

4.前言

这一部分写得真好,十分建议大家多读上几遍,主要是为了心情上的愉悦!

图片

5.数据

特征在table1训练集合和验证集及总的呈现,特征在table2结局发生和不发生的情况,这两张表建议同时附上,笔者发现有些文章不一定做到这两种表呈现,最好是都进行。这两张做得很完美了,如果非要挑一个小问题的话,那就其实可先呈现连续变量,分类变量后呈现,就不要穿插,这样的安排是否更加完美些呢?    

图片

图片

6.模型开发

这是该预测模型基于机器学习的开发过程,分成了三个步骤:数据预处理,算法训练,和算法测试。在算法训练过程中,我们可以看出作者通过参数调整、网格搜索和随机搜索来识别最优超参数,当然我们也可以采用贝叶斯优化进行进行对超参数调优。    

图片

7.网格搜索和随机搜索

如果读者想要对网格搜索和随机搜索进一步了解,可以在必应检索中输入“Hyperparameter Optimization With Random Search and Grid Search”。

图片    

图片

8.人工超参数调优的结果,均进行了呈现

图片

9.ROC

每个模型ROC的情况,真的做到了极致,有分有总!Beautiful!   

图片

10.利用SHAP进行解释

最后,作者基于综合考虑选取了随机森林,并采用SHAP对模型进行了解释,毕竟现在流行“可解释的人工智能”。我们的平台推文也有对SHAP技术的介绍哦!(在内部搜索“解释”即可)

图片

11.局限性

第一句话就来了双重否定,笔者这个英语迷真的痴迷了会。   

图片

最后,笔者觉得,这篇文章真心不错,十分推荐给刚接触机器学习的读者们品读,不管是图表的呈现,亦或是写作,都值得我们好好学习!

好啦,本期的内容就到这里!很多机器学习的内容均可以在公众号获得,至于方法,点开菜单栏,你就明白了。下面给个以前的汇总链接:

九大合集!2023年度本平台原创文章汇

考文献:

Kitcharanant N, Chotiyarnwong P, Tanphiriyakun T, Vanitcharoenkul E, Mahaisavariya C, Boonyaprapa W, Unnanuntana A. Development and internal validation of a machine-learning-developed model for predicting 1-year mortality after fragility hip fracture. BMC Geriatr. 2022 May 24;22(1):451. doi: 10.1186/s12877-022-03152-x. PMID: 35610589; PMCID: PMC9131628.

免责:所有内容均为免费分享,仅用于个人科研学习,目的是促进护理学科的科研水平,不用于任何商业用途。如您觉此文侵犯了您的权利,请联系我们,谢谢。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多