近期,大规模语言模型ChatGPT、Google Bard和微软Bing在医学领域的应用备受关注。一项最新研究对比了这三个模型在血液病学案例解析中的表现。研究结果显示,ChatGPT的表现最佳,其次是Bard,Bing的表现最差。具体来说: 1. 研究人员收集了50个血液病学相关的案例,涵盖血液疾病、血液肿瘤、实验室指标等,让三个语言模型作答。 2. ChatGPT的平均得分显著高于另外两个模型,也高于课程50%的通过分数。这表明其在血液病学案例解析中表现强劲。 3. Bard的表现次之,得分接近及格线。Bing的表现最差,得分显著低于及格线。 4. 研究提示,ChatGPT在医学领域具有巨大潜力。但是所有模型在答题准确性上都有待进一步提高。 5. 语言模型的优化研究对医疗保健和医学教育应用具有重要价值。 这项研究为语言模型在专业医学领域的应用提供了宝贵经验,也向我们展示了语言模型服务的发展方向。ChatGPT的优异表现令人鼓舞,但仍需谨慎对待其输出结果。语言模型服务还需不断优化,才能真正助力医疗决策。 另外,小编应广大网友要求,特建立ChatGPT等人工智能机器语言群。欢迎入群,进群请备注。也可加小编VX,直接邀请入群。 【免责声明】图文来自网络,版权属于原作者,如有侵权或非授权发布之嫌,请联系我们,我们将及时更正、删除。转载目的在于促进信息交流,并不代表本公众号赞同其观点或对其内容真实性负责。欢迎关注PaperRSS公众号,每天都在更新。 |
|