撰稿人: 统计小可爱 当学会R语言的数据导入,我们便可以着手进行数据处理和分析了。但在此之前,我们还需要了解一下R语言可以处理的数据类型以及储存数据的结构。 数据类型 R对象的类型(模式)包括: 数值型 Numeric 如 : 100, 0, -4.335; 字符型 Character 如 :“China”; 逻辑型 Logical 如: TRUE, FALSE; 因子型 Factor 名义型变量或有序型变量。 复数型 Complex 如:2 3i。 数据结构 R语言中的数据结构,主要包括向量、矩阵、数组、数据框和列表等几种形式,如图示。下面我们就来逐个介绍每一种数据结构。 图片来源于: 《R in Action:Data Analysis and Graphics with R》 01 向 量(Vector) 向量是用于存储数值型、字符型或逻辑型数据等的一维数组。执行组合功能的函数 c( ) 可用来创建向量。(注:c为小写) 例: 值得注意的是,单个向量中的数据类型是固定的,比如数值型向量中的元素就必须全为数值,而文本型向量中的元素必须全部为文本。 02 矩 阵(Matrix) 矩阵是一个二维数组,是数组的一个特例。每个元素都拥有相同的模式(数值型、字符型或逻辑型)。可以通过函数matrix()来创建矩阵。一般使用格式为: mymatrix<-matrix(vector, nrow=, ncol=, byrow=,dimnames=list(rownames, colnames)) vector:包含矩阵的元素; nrow:指定行的维数; ncol:指定列的维数; dimnames: 包含了可选的,以字符型向量表示的行名和列名; byrow:表明矩阵按行填充(byrow=TRUE)还是按列填充(byrow=FALSE),默认按列填充。 例: 03 数 组(Array) 数组与矩阵类似,但是维度可以大于2。数组可以通过array函数创建。 例: 04 数 据 框(Data Frames) 数据框是由一个或几个向量和(或)因子构成,它们必须是等长的,但可以是不同的数据类型(数值型、字符型等)的数据。它与SAS、SPSS和Stata中看到的数据集类似,是R种最常处理的数据结构。数据框可以通过data.frame( )函数创建。 例: 05 列 表(List) 列表就是一些对象(或成分)的有序集合。列表可以包含任何类型的对象,包括若干向量、矩阵、数据框,甚至是其他列表的组合。可以使用函数list( )创建列表。 例: 06 因 子(Factor) 类别(名义型)变量和有序类别(有序型)变量在R中称为因子。因子是R语言中比较特殊的一个数据类型,它决定了数据的分析方式以及如何进行视觉呈现。通常用函数factor( )来创建因子。 例: |
|
来自: 刘p7557pnygqhy > 《R语言》