R语言 | 第八讲：R语言数据管理（四）

刘p7557pnygqhy 2018-10-12

展开全文

撰稿人：统计小可爱，Keeper

随机抽样在机器学习和数据处理分析领域应用广泛，例如预测模型研究，通过随机抽样原始数据分为训练集和测试集，以便比较选择出最优的模型。

随机抽样，即按照随机的原则，保证总体中每个单位都有同等机会被抽中的原则抽取样本的方法，可分为等概率放回随机抽样和不放回随机抽样。

sample（）函数

在R语言中，我们可以利用sample（）函数来完成简单的随机抽样，其基本形式为：

sample（x,size,replace=TRUE）

x：整体数据。

size：抽取样本的数目。

replace：=FALSE,为不放回抽样，=TRUE,为放回抽样。默认为FALSE。

示例：

1. 假如我们要从1到50数据中不重复地随机抽取10个元素作为样本。

sample(1:50,size=10)

[1] 13 29 50 2 37 42 25 31 35 3

2. 假如我们要从1到50数据中重复地抽取10个元素作为样本。

sample(1:50,size=10,replace=TRUE)

[1] 25 4 47 29 38 50 19 8 39 4

3. 假如我们要从pbc数据中随机抽取一个大小为10的样本。

mysample<- pbc[sample(1:nrow(pbc), 10, replace=FALSE)]

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：刘p7557pnygqhy > 《R语言》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

刘p7557pnygqhy

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换