SCI！基于机器学习的预测模型开发及验证是怎样的？

葛医生_EP日记 2024-02-20 发布于广西

展开全文

进入本期内容之前，为我们的小平台做个小推广：

我们公众号已有约2 0000名读者朋友关注，我们立足于发展护理科研事业，但不局限于护理，如果您对机器学习和深度学习感兴趣，甚至想把它应用于护理或临床科研，请关注护理统计随笔并设置为星标，我们会长期致力于做好对机器学习和深度学习等相关内容的分享，当然还有循证医学、心理测量及各种科研软件甚至编程语言的使用等等。在这里，可以接触到大量您之前未做过或未听过的内容，因此希望可以帮忙转发（纯自愿）。此外，欢迎加入交流群，与我们一起学习。

在这个数字化时代，基于机器学习的预测模型已经成为解锁未来的一把魔法钥匙。它们如何能够预测股市走势、天气变化，甚至是你下一次在线购物的选择？机器学习越来越火爆！浪越大，鱼越贵！在分享本期的文献前，我们有必要了解下机器学习的常见类型。

1.监督学习（Supervised Learning）：在训练过程中，模型通过使用带有标签的输入数据来学习，即输入数据和相应的输出标签一一对应。

2.无监督学习（Unsupervised Learning）：模型在训练过程中使用没有标签的数据，目标是发现数据中的结构和模式。

3.半监督学习（Semi-Supervised Learning）：这是监督学习和无监督学习的结合，其中模型使用部分带有标签的数据和大量没有标签的数据进行训练。

4.强化学习（Reinforcement Learning）：模型通过与环境的互动学习，通过尝试最大化某种奖励信号来做出决策。

5.自监督学习（Self-Supervised Learning）：模型从输入数据中学习，但不需要外部标签。相反，它根据输入数据中的某种内部结构或信息来自我监督。

6.迁移学习（Transfer Learning）：模型在解决一个任务上学到的知识被迁移到解决另一个相关任务上，从而提高模型的性能。

笔者在有限的阅读量内，发现我们护理这一块主要也只是做到了监督学习在预测模型的应用，也有小部分文献使用了Apriori关联规则学习（无监督学习的一种）。其实，预测模型看多了，笔者也在思考一个问题：我们卷数据、卷方法的目的到底是为了什么？说句实在话，没合理的答案，大概这个问题太哲学！如果问题暂时没有答案，那就先学着呗！

本期，笔者解剖的是泰国学者发表在BMC上的预测模型文献！这篇文章很赏心悦目！

1.摘要

从摘要我们得知作者基于回顾性的资料，采用7种机器学习的方法进行训练和内部验证，总体的评价指标不错，而随机森林构建的预测模型无疑是相对较好的。这篇文章也进行了注册，同时模型也有可视化呈现（web application）。

2.模型可视化呈现

作者也对该模型做了可视化（应用程序），并进行了免责声明，这是非常聪明的做法！做预测模型的读者们，如果将模型进行可视化的话，何不学一下！

3.关键词

归纳性非常好的关键词

4.前言

这一部分写得真好，十分建议大家多读上几遍，主要是为了心情上的愉悦！

5.数据

特征在table1训练集合和验证集及总的呈现，特征在table2结局发生和不发生的情况，这两张表建议同时附上，笔者发现有些文章不一定做到这两种表呈现，最好是都进行。这两张做得很完美了，如果非要挑一个小问题的话，那就其实可先呈现连续变量，分类变量后呈现，就不要穿插，这样的安排是否更加完美些呢？

6.模型开发

这是该预测模型基于机器学习的开发过程，分成了三个步骤：数据预处理，算法训练，和算法测试。在算法训练过程中，我们可以看出作者通过参数调整、网格搜索和随机搜索来识别最优超参数，当然我们也可以采用贝叶斯优化进行进行对超参数调优。

7.网格搜索和随机搜索

如果读者想要对网格搜索和随机搜索进一步了解，可以在必应检索中输入“Hyperparameter Optimization With Random Search and Grid Search”。

8.人工超参数调优的结果，均进行了呈现

9.ROC

每个模型ROC的情况，真的做到了极致，有分有总！Beautiful！

10.利用SHAP进行解释

最后，作者基于综合考虑选取了随机森林，并采用SHAP对模型进行了解释，毕竟现在流行“可解释的人工智能”。我们的平台推文也有对SHAP技术的介绍哦！（在内部搜索“解释”即可）

11.局限性

第一句话就来了双重否定，笔者这个英语迷真的痴迷了会。

最后，笔者觉得，这篇文章真心不错，十分推荐给刚接触机器学习的读者们品读，不管是图表的呈现，亦或是写作，都值得我们好好学习！

好啦，本期的内容就到这里！很多机器学习的内容均可以在公众号获得，至于方法，点开菜单栏，你就明白了。下面给个以前的汇总链接：

九大合集！2023年度本平台原创文章汇
总

参考文献：

Kitcharanant N, Chotiyarnwong P, Tanphiriyakun T, Vanitcharoenkul E, Mahaisavariya C, Boonyaprapa W, Unnanuntana A. Development and internal validation of a machine-learning-developed model for predicting 1-year mortality after fragility hip fracture. BMC Geriatr. 2022 May 24;22(1):451. doi: 10.1186/s12877-022-03152-x. PMID: 35610589; PMCID: PMC9131628.

免责声明：所有内容均为免费分享，仅用于个人科研学习，目的是促进护理学科的科研水平，不用于任何商业用途。如您觉得此文侵犯了您的权利，请联系我们，谢谢。