分享

R语言读取文件夹下多个文件并进行合并数据生成总数据文件

 井里的怪兽 2018-12-16

转自:http://blog.csdn.net/qq_34941023/article/details/51550085

 

在流水化办公中,通常有格式统一的表格文件产生,但是到最后要将这一堆表格文件整合为大表却很揪心,累断手,如何用R语言进行一次性导入整合呢?

假设我们将D:/input文件夹作为需要导入的表格的存放点,文件夹内所有文件均为此次需要导入数据,那么可以用以下程序进行操作

 setwd("D:/")                                                                    #设定工作目录为D盘
 a = list.files("input")                                                       #list.files命令将input文件夹下所有文件名输入a
 dir = paste("./input/",a,sep="")                                      #用paste命令构建路径变量dir
n = length(dir)                                                                 #读取dir长度,也就是文件夹下的文件个数
 merge.data = read.csv(file = dir[1],header=T,sep=",")   #读入第一个文件内容(可以不用先读一个,但是为了简单,省去定义data.frame的时间,我选择先读入一个文件。
 for (i in 2:n){
   new.data = read.csv(file = dir[i], header=T, sep=",")
   merge.data = rbind(merge.data,new.data)
 }

#循环从第二个文件开始读入所有文件,并组合到merge.data变量中
write.csv(merge.data,file = "./input/merge.csv",row.names=F)  #输出组合后的文件merge.csv到input文件夹

 

PS.若为TXT文件

 #==============批量读入TXT文件======================

a = list.files("input")

dir = paste("./input/",a,sep="")            

n = length(dir)     

merge.data = read.table(file = dir[1],header=TRUE,dec = ".")

for (i in 2:n){

  new.data = read.table(file = dir[i], header=TRUE, dec = ".")

  merge.data = rbind(merge.data,new.data)

}

write.table(merge.data,file = "./input/merge.txt",row.names=F)  

#===========================================================

 

 

另外,如果懒得转换为csv,在所有excel都是只有一个sheet的时候,可以用下面的命令作为读取

首先在最开头需要安装和调用package:

install.packages("XLConnect")
 library("XLConnect")

 

 然后在正文中将 merge.data = read.csv(file = dir[1],header=T,sep=",")替换为 

merge.data = readWorksheetFromFile(file = dir[i], sheet=1, header=TRUE)

 

将new.data = read.csv(file = dir[i], header=T, sep=",")替换为

 new.data = readWorksheetFromFile(file = dir[i], sheet=1, header=TRUE)

 

写入新文件除需要复杂一点,基于下面的程序,大家可以尝试改写一下:

# 读取或创建一个XLSX文件,此步相当于建立一个连接
xls <- loadWorkbook('test.xlsx',create=TRUE)
# 创建工作表
createSheet(xls,name='namesheet')
# 写入数据
writeWorksheet(xls,iris,'nameshee',
               startRow=1,startCol=1, # 数据出现的左上角位置
               header=TRUE)
# 存入硬盘,直到此步方才有文档生成
saveWorkbook(xls)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约