一、内部验证的定义 内部验证(internal validation)是我们建模后首先要进行的一项模型验证工作,也就是在训练数据集上,应用各种方法来评估模型的性能(主要是对区分度的评价),目的是评估模型在当前数据集上的表现,可以在一定程度上检测是否存在过拟合,以判断其未来在新数据上的泛化能力。但无论如何,内部验证终究是在训练集上进行的操作,无法真正评估模型在新数据上的泛化能力。 二、内部验证的常见方法 2. 自助法:从原始样本集合中有放回地随机抽取n个样本(n通常等于原始样本数),构建一个新的样本集合,这个新的样本集合称为"Bootstrap样本",因为随机抽取是有放回的,因此某些样本可能多次出现在新的"Bootstrap样本"中(如下图)。之后使用Bootstrap样本进行模型训练,并重复多次(通常重复1000次以上),并计算模型性能。 上述的方法都可以在论文中使用,可以根据具体的情况选取不同的方法。 那么这就是本期的全部内容啦,你学会了吗?大家对于推送内容有任何问题或建议可以在公众号菜单栏“更多--读者的话”栏目中提出,我们会尽快回复! 参考文献 |
|
来自: 新用户4064dVjo > 《待分类》