分享

R语言 | 第四讲:R语言数据类型及结构

 刘p7557pnygqhy 2018-10-12

撰稿人: 统计小可爱


当学会R语言的数据导入,我们便可以着手进行数据处理和分析了。但在此之前,我们还需要了解一下R语言可以处理的数据类型以及储存数据的结构。

 数据类型

R对象的类型(模式)包括:

数值型 Numeric

如 : 100, 0, -4.335;

字符型 Character

如 :“China”;

逻辑型 Logical

如: TRUE, FALSE;

因子型 Factor

名义型变量或有序型变量。

复数型 Complex

如:2 3i。

 数据结构

R语言中的数据结构,主要包括向量矩阵数组数据框列表等几种形式,如图示。下面我们就来逐个介绍每一种数据结构。

图片来源于:

R in Action:Data Analysis and Graphics with R

01

向 量(Vector)

向量是用于存储数值型、字符型或逻辑型数据等的一维数组。执行组合功能的函数 c( ) 可用来创建向量。:c为小写)

例:

值得注意的是,单个向量中的数据类型是固定的,比如数值型向量中的元素就必须全为数值,而文本型向量中的元素必须全部为文本。

02

矩 阵(Matrix)

矩阵是一个二维数组,是数组的一个特例。每个元素都拥有相同的模式(数值型、字符型或逻辑型)。可以通过函数matrix()来创建矩阵。一般使用格式为:

mymatrix<-matrix(vector, nrow=, ncol=, byrow=,dimnames=list(rownames, colnames))

vector:包含矩阵的元素;

nrow:指定行的维数;

ncol:指定列的维数;

dimnames: 包含了可选的,以字符型向量表示的行名和列名;

byrow:表明矩阵按行填充(byrow=TRUE)还是按列填充(byrow=FALSE),默认按列填充。

例:

03

数  组(Array)

数组与矩阵类似,但是维度可以大于2。数组可以通过array函数创建。

例:

04

数 据 框(Data Frames)

数据框是由一个或几个向量和(或)因子构成,它们必须是等长的,但可以是不同的数据类型(数值型、字符型等)的数据。它与SAS、SPSS和Stata中看到的数据集类似,是R种最常处理的数据结构。数据框可以通过data.frame( )函数创建。

例:

05

列  表(List)

列表就是一些对象(或成分)的有序集合。列表可以包含任何类型的对象,包括若干向量、矩阵、数据框,甚至是其他列表的组合。可以使用函数list( )创建列表。

例:

06

因  子(Factor)

类别(名义型)变量和有序类别(有序型)变量在R中称为因子。因子是R语言中比较特殊的一个数据类型,它决定了数据的分析方式以及如何进行视觉呈现。通常用函数factor( )来创建因子。

例:


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多