分享

R语言 | 第八讲:R语言数据管理(四)

 刘p7557pnygqhy 2018-10-12

撰稿人:统计小可爱,Keeper


随机抽样在机器学习和数据处理分析领域应用广泛,例如预测模型研究,通过随机抽样原始数据分为训练集和测试集,以便比较选择出最优的模型。

随机抽样,即按照随机的原则,保证总体中每个单位都有同等机会被抽中的原则抽取样本的方法,可分为等概率放回随机抽样和不放回随机抽样。

 sample()函数

在R语言中,我们可以利用sample()函数来完成简单的随机抽样,其基本形式为:

sample(x,size,replace=TRUE)

x:整体数据。

size:抽取样本的数目。

replace:=FALSE,为不放回抽样,=TRUE,为放回抽样。默认为FALSE。

示例:

1. 假如我们要从1到50数据中不重复地随机抽取10个元素作为样本。

sample(1:50,size=10)

[1] 13 29 50 2 37 42 25 31 35 3

2. 假如我们要从1到50数据中重复地抽取10个元素作为样本。

sample(1:50,size=10,replace=TRUE)

[1] 25 4 47 29 38 50 19 8 39 4

3. 假如我们要从pbc数据中随机抽取一个大小为10的样本。

mysample<- pbc[sample(1:nrow(pbc), 10, replace=FALSE)]



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多