一千个学习R的理由R拥有许多用于存储数据的对象类型, 包括标量、向量、矩阵、数组、数据框和列表。 它们在存储数据的类型、创建方式、结构复杂度, 以及用于定位和访问其中个别元素的标记等方面均有所不同。 下图是一张R语言数据结构图。 文章目录 快速检索,先看看哪部分感兴趣,查漏补缺~
1.定义: 用于存储数值型、字符型或逻辑型数据的一维数组。 向量中的元素类型必须全为数值型或者字符型或者逻辑型。 向量中的单个元素称为标量,属于特殊的向量。 向量是R语言中最基础,也是最重要的数据类型。 2. 向量类型: 数值型向量:向量中的元素全为数字 字符型向量:向量中的元素既可以全为字符,也可以包含数字,但是这里的数字是字符串,并不是数值。 逻辑型向量:向量中的元素只有两种TURE或者FALSE 3. 向量的创建 数值型向量的创建 矩阵 1. 定义:
2. 矩阵的创建: 3. 矩阵下标的使用: 数组 定义:
数据框 1. 定义:
数据框是R中最常见的数据结构之一,一般数据处理都是基于数据框。 选取数据框的元素数据框中常见的元素选择方法有三种。 方法一: 和矩阵下标的使用一样,不再过多介绍。 方法二:变量名筛选 方法三:
因子 在我们处理的数据中,通常将数据框中的列(成分)也称为变量或者属性,而行称为观测或者示例,在R中把数据框的列叫做变量更普遍。变量是统计学中的名词,在数据框中变量既可以是向量,也可以是因子。变量通常有三种类型,名义型(类别型)、有序型和连续型变量。 变量类型: 名义型变量:性别有男女之分,体型有胖瘦之别,这些都是名义型(类别型)变量 有序型变量:癌症的分期有早期、中期和晚期,变量中的值有顺序之分,称为有序变量 连续型变量:人的体重就是连续型变量,表现为一定范围内的任意值,与数值型向量等价。 名义型变量和有序性变量在R中统称为因子 列表 定义:
处理对象的通用函数 数据转换 特殊数据 参考资料R语言实战(二) 点个赞,证明你还爱我 科研路漫其修远兮,吾将上下而求索,有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。 踌躇满志无限期 扬帆起航正当时 科研小助理为您在线解答 |
|
来自: 启帆医学BioSCI > 《待分类》