费了九牛二虎之力、历尽千辛万苦收集了数据,终于走到了分析这一步。分析前少不了将数据导入/录入分析软件。但因为纯命令的原因,很多时候R都是我们最后的或者不得已的选择,所以我们在用到R时拿到的数据可能有很多种格式,比如excel(.xlsx)、SPSS(.sav)、STATA(.dta)、SAS(sas7bdat)、CSV(.csv)等。一般来说,面对海量的数据,我们不会逐条录入,导入是最佳的选择。 【1】导入Excel文件:read_excel{readxl} ##导入名称为“Diabetes”的Excel文件中的第2个sheet(工作表),该工作表名称为”blood”,Excel文件存放在D盘DATA的文件夹中。将导入到R中的这个excel文件储存在数据框Diabetes中。 library(readxl) 其他常用: read.xlsx{openxlsx}: 【2】导入SPSS文件:read_sav{haven} library(haven) 程序包haven还可导入SPSS(read_sav)、STATA(read_dta)和SAS(read_sas)等多种形式的文件。其他导入SPSS文件的常用程序包函数有: read.spss{foreign}: spss.get{Hmisc}: 【3】导入STATA文件:read_dta{haven} library(haven) 其他常用read.spss{foreign}: foreign程序包也可以读取如Minitab、S、SAS、SPSS、Stata、Systa、Weka、dBase等多种形式的数据。需要注意的是,read.dta只能读取stata5-stats12的数据。 【4】导入CSV、TXT文件 最后友情提示一下,不要忘记了任何一个软件一般都会有一个“另存为”的功能,通过软件将数据存储为你最熟悉的格式往往会起到事半功倍的效果。 |
|
来自: Memo_Cleon > 《待分类》