分享

简单七步教你处理芯片原始数据

 田明17grajsnth 2017-09-24

广告:工作室提供有偿芯片数据分析,大家有芯片相关数据处理,请留言....

很久没有处理芯片原始数据了,一般情况下去GEO下载数据的时候都是直接下载处理后的,所以用着用着也就懒了,今天去下载GSE42743的数据如图,发现竟然没有处理好的,纠结之余小编决定亲自从原始数据入手,开启洪荒之力。

下面小编就一步一步教你实战GEO芯片原始数据处理





01



下载芯片数据,进入GEO首页搜索跟自身研究相关的GEO数据集,找到合适的数据比如GSE42743,点击进去找到如下图所示,可以看到File type为CEL即为原始数据啦,看到左侧有个http有木有,点击下载就哦啦





02

安装affy包,很显然原始芯片数据需要专门的包去处理,這里要使用affy包进行数据处理,所以安装這个affy包也很简单,有两种方法如下:

1、install.package('affy')

2、

source('https:///biocLite.R')

biocLite('affy')

择其一选择安装即可,如果一种方法不行就换一种


03

导入affy包,这里因为affy包可能用到其他的包,所以导入affy包之前需要导入它所依赖的包,如果没有安装的话,就自行安装就好了,导入包如下:

library(BiocGenerics)

library(parallel)

library(Biobase)

library(affy)


04

设置数据环境,导入affy完毕了之后,现在需要配置数据环境以便能够对原始数据提取,先解压下载下来的GSE42743_RAW文件,然后可以看到所有的CEL文件都在这个文件夹下面,可能你会发现后缀怎么会有个gz,不用担心这是一种数据压缩格式,affy会自动解压,无需自己提前解压;现在要设置当前操作目录,使用命令如下:

setwd('E:/Work/P1/SH824/GSE42743_RAW')

注意哦,路径别写错啦



05

读取原始数据啦,通过包的导入和数据环境的准备之后,现在开始读取数据,也很简单啦,有两种方式哦,代码如下:

1、rawdata <- ReadAffy()###读取全部的原始文件,这个时候就考验你的电脑内存了

2、rawdata1 <- ReadAffy('GSM1049165_MDA-HNS-112.CEL.gz')###读取单个原始文件


06

标准化,读取完数据当然是处理和标准化啦,这一步呢也是一条命令的事,但是芯片数据标准化方法很多,小编常常使用的两种标准化方法分别为rma和mas5,这里都奉献给你吧,代码如下:

1、eset <- rma(rawdata) #rma标准化方式

2、eset <- mas5(rawdata)#mas5标准化方式

注意哦,rma只使用pm信号,exp数据已经进行log2处理。mas5综合考虑pm和mm信号,exp数据没有取对数。


07

很显然,现在要把得到的芯片数据标准化的结果进行保存了,使用代码如下:

write.exprs(eset, file='NormalizedData.txt')

保存在了当前工作目录下哦


当然如果你不想保存,还想继续用的话就使用exprs函数进行转换成表达谱矩阵啦,代码如下:

exp <- exprs(eset)

总结一下小编的代码如下




library(BiocGenerics)

library(parallel)

library(Biobase)

library(affy)


setwd('GSE42743_RAW')

rawdata <- ReadAffy()

eset <- rma(rawdata)#eset <- mas5(rawdata)

#rawdata1 <- ReadAffy('GSM1049165_MDA-HNS-112.CEL.gz')

write.exprs(eset, file='NormalizedData.txt')


小贴士

这其中呢要画图嘛,主要涉及两张图,一张是标准化前的,一张是标准化后的箱线图,其实也很简单啦

标准化前,绘图,代码如下:

boxplot(exprs(rawdata))

没图!!!!因为小编电脑死机了

标准化后,绘图代码如下:

boxplot(exprs(eset))


怎么看这个前后效果呢,就看图中小编画了红色的那条线,中位数的分布是否在一条线上,很明显标准化前都不全在一条线上(无图无真相,自己试吧),标准化后在一条线上了。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多