今天是生信星球陪你的第326天 大神一句话,菜鸟跑半年。我不是大神,但我可以缩短你走弯路的半年~ 就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~ 这里有豆豆和花花的学习历程,从新手到进阶,生信路上有你有我! 原课程链接: 学习目标
1.什么是R?有人认为R是一种编程语言,这是一种常见的错误理解,因为R远不止于此。将R视为统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能。 R环境结合了:
2.为什么用R?开源、可视化、数据科学、统计计算、平台无关(platform agnostic) R是一个功能强大,可扩展的环境。它具备各种数据统计、通用数据分析和可视化功能。
3.什么是RStudio?RStudio是免费提供的开源集成开发环境(IDE)。RStudio提供了一个具有很多功能的环境,使R更容易使用,是在终端中使用R的绝佳选择。
4.在RStudio中创建一个新的project目录让我们为今天的“R简介”课程创建一个新的项目目录。
5.RStudio界面RStudio界面有四个主要面板:
6.组织你的工作目录和设置6.1查看你的工作目录在组织工作目录之前,先检查当前工作目录的位置,在控制台中输入命令: getwd() 你的工作目录应该是 可以通过 如果要选择其他文件夹作为工作目录,可以在右下角 6.2 构建工作目录要组织某个项目的工作目录,应将原始数据(原始数据)与中间数据集分开。例如,可能希望在工作目录中创建一个存储原始数据的 可以通过 完成后,工作目录应如下所示: 6.3 将文件添加到工作目录我们将在接下来的几节课中介绍几个文件,点击以下链接访问。如果右键单击该链接,并将“链接另存为…”,定位到工作目录。即可看到该文件出现在工作目录中。我们将在本课后稍后讨论这些文件。
6.4 配置设置长代码自动换行,不用左右滚动查看长代码。 单击RStudio屏幕顶部的“Tools”,然后单击下拉菜单中的“Global Options”。 在左侧,选择“代码”并检查“软包装R源文件”。确保单击窗口底部的“应用”按钮,然后单击“确定”。 7.与R交互现在我们已经设置好了界面和目录结构,开始玩转R语言!在RStudio中与R交互有两种主要方式:使用控制台或使用脚本编辑器(脚本是包含代码的纯文本文件)。 7.1 控制台窗口该控制台窗口(在RStudio,左下面板)是其中R是等着你来告诉它做什么的地方,在那里它会显示每个命令的结果。可以直接在控制台中键入命令,但session关闭时会清空。 我们来测试一下:
7.2 脚本编辑器最佳做法是在脚本编辑器中输入命令,然后保存脚本。我们鼓励使用 Rstudio脚本编辑器允许通过单击脚本编辑器右上角的 现在让我们尝试向脚本编辑器输入命令,并使用注释字符 # Intro to R Lesson 选中要运行的命令,点击 如果不加注释符号
现在R试图将该句子作为命令运行,但它不起作用。我们在控制台中出现错误“Error: unexpected symbol in “I am” ,意味着R解释器不知道如何处理该命令。* 7.4 控制台命令提示符解释命令提示符有助于了解R何时准备好接受命令。下面列出了命令提示符的不同状态以及如何退出命令: (1)控制台已准备好接受命令: 如果R准备好接受命令,则R控制台会显示 当控制台收到命令时(通过直接键入控制台或从脚本编辑器( 运行后,控制台将显示结果并返回新 (2)控制台正在等待输入更多数据: 如果R仍在等待输入更多数据,因为它尚未完成,控制台将显示 (3)转义命令并获得新提示: 如果无法弄清楚为什么命令没有运行,可以在控制台窗口内单击并按下 练习
8.与R中的数据交互R通常用于处理大数据,因此只有在数据处理实战中理解R语言才有意义。我们之前已将两个文件下载到工作目录中。由于后期需要使用这些文件,因此我们需要花几分钟时间熟悉这些数据。 数据集在这个示例数据集中,我们收集了来自12只小鼠的全脑样本,并且想要评估它们之间的表达差异。表达数据表示从12个脑样品的RNA测序获得的标准化计数数据。该数据作为二维矩阵存储在逗号分隔值(CSV)文件中,每行对应于基因,每列对应于样本。 ![]() metadata我们有另一个文件,我们在其中识别相关数据或metadata的信息。我们的元数据也存储在CSV文件中。在此文件中,每行对应一个样本,每列包含有关每个样本的一些信息。 第一列包含行名称,请注意这些行名称与上面的表达数据文件中的列名称相同(尽管顺序不同)。接下来的几列包含有关我们样本的信息,这些信息允许我们对它们进行分类。例如,第二列包含每个样品的基因型信息。每个样品分为两类:Wt(野生型)或KO(淘汰)。在其余列中观察到哪些分类? ![]() R特别擅长处理这类分类数据。数据不是简单地将该信息存储为文本,而是以特定的数据结构表示,该结构允许用户以快速有效的方式对数据进行排序和操作。当我们学习R中的不同课程时,我们将更详细地讨论这个问题! 9.最佳实践在我们开始研究更复杂的概念并熟悉语言之前,我们想要指出一些关于使用R时最佳实践的事情,这将有助于组织项目:
|
|