撰稿人:统计小可爱,Keeper 随机抽样在机器学习和数据处理分析领域应用广泛,例如预测模型研究,通过随机抽样原始数据分为训练集和测试集,以便比较选择出最优的模型。 随机抽样,即按照随机的原则,保证总体中每个单位都有同等机会被抽中的原则抽取样本的方法,可分为等概率放回随机抽样和不放回随机抽样。 sample()函数 在R语言中,我们可以利用sample()函数来完成简单的随机抽样,其基本形式为: sample(x,size,replace=TRUE) x:整体数据。 size:抽取样本的数目。 replace:=FALSE,为不放回抽样,=TRUE,为放回抽样。默认为FALSE。 示例: 1. 假如我们要从1到50数据中不重复地随机抽取10个元素作为样本。 sample(1:50,size=10) [1] 13 29 50 2 37 42 25 31 35 3 2. 假如我们要从1到50数据中重复地抽取10个元素作为样本。 sample(1:50,size=10,replace=TRUE) [1] 25 4 47 29 38 50 19 8 39 4 3. 假如我们要从pbc数据中随机抽取一个大小为10的样本。 mysample<- pbc[sample(1:nrow(pbc), 10, replace=FALSE)] |
|
来自: 刘p7557pnygqhy > 《R语言》