分享

收藏|零基础学R之数据结构,一个学习R的理由足够

 启帆医学BioSCI 2020-08-01

一千个学习R的理由
学习一门新的编程语言相当于一项大的投资,如果有一门编程语言能让你的投资带来很高的回报,小助理的建议是先学习R
预计阅读时间4分钟


R拥有许多用于存储数据的对象类型

包括标量、向量、矩阵、数组、数据框和列表

它们在存储数据的类型、创建方式、结构复杂度,

以及用于定位访问其中个别元素的标记等方面均有所不同。

下图是一张R语言数据结构图。

文章目录

快速检索,先看看哪部分感兴趣,查漏补缺~

  • 向量

    • 向量类型

    • 向量的创建

    • 向量中元素的访问

  • 矩阵

    • 矩阵的创建

    • 矩阵下标的使用

  • 数组

    • 数组的创建

  • 数据框

    • 数据框的创建

    • 选取数据框的元素

  • 因子

    • 因子的创建

  • 列表

    • 列表的创建

    • 列表中对象的提取

  • 处理对象的通用函数

  • 数据转换

  • 特殊数据

  • 参考资料

  • 向量

 1.定义

用于存储数值型、字符型或逻辑型数据的一维数组

向量中的元素类型必须全为数值型或者字符型或者逻辑型。

向量中的单个元素称为标量,属于特殊的向量。

向量是R语言中最基础,也是最重要的数据类型。

2. 向量类型:

数值型向量:向量中的元素全为数字

字符型向量:向量中的元素既可以全为字符,也可以包含数字,但是这里的数字是字符串,并不是数值。

逻辑型向量:向量中的元素只有两种TURE或者FALSE

3. 向量的创建

数值型向量的创建


矩阵

1. 定义:

  • 矩阵是二维数组,矩阵中的元素都拥有相同的类型。大多数情况下,我们使用的矩阵就是数值型矩阵,矩阵中的元素全为数值,矩阵也可以理解为折叠起来的数值型向量。

2. 矩阵的创建:

3. 矩阵下标的使用


数组

定义:

  • 数组和矩阵基本上属于一种数据类型,矩阵是特殊的数组,而数组一般指三维及以上。数组在R语言中用的很少,所以这里只写出数组的创建方法。


数据框

1. 定义:

  • 数据框和矩阵结构相似,由行列组成,数据框中每一列为一个成分,数据框中的成分类型分为两种:一种是向量,另外一种是因子。

数据框是R中最常见的数据结构之一,一般数据处理都是基于数据框。

选取数据框的元素

数据框中常见的元素选择方法有三种

方法一: 和矩阵下标的使用一样,不再过多介绍。

方法二:变量名筛选

方法三:

  • 使用attach()函数和deteach()函数

  • 使用with()函数,with()函数使用有一个缺点,with()函数里面赋值给对象需要用<<-,不能用<-或者=,只有这样才可以将对象保存到全局环境中。

因子

在我们处理的数据中,通常将数据框中的列(成分)也称为变量或者属性,而行称为观测或者示例,在R中把数据框的列叫做变量更普遍。变量是统计学中的名词,在数据框中变量既可以是向量,也可以是因子。变量通常有三种类型,名义型(类别型)、有序型和连续型变量。

变量类型

名义型变量:性别有男女之分,体型有胖瘦之别,这些都是名义型(类别型)变量

有序型变量:癌症的分期有早期、中期和晚期,变量中的值有顺序之分,称为有序变量

连续型变量:人的体重就是连续型变量,表现为一定范围内的任意值,与数值型向量等价。

名义型变量和有序性变量在R中统称为因子

列表

 定义:

  • 列表是R语言中高级数据类型,列表是一些对象的有序集合,对象为任何一种数据类型。列表中的对象可以是向量、矩阵、数组、数据框和因子,甚至列表中也可以包含列表。


处理对象的通用函数



数据转换



特殊数据


参考资料

R语言实战(二)

一千个学习R的理由都不够你的一次分享,点击【写留言】

点个赞,证明你还爱我

科研路漫其修远兮,吾将上下而求索,有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。

踌躇满志无限期

扬帆起航正当时

科研小助理为您在线解答


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多