分享

基因芯片数据分析

 萌小芊 2018-03-11

>source('http://www./biocLite.R')

> biocLite('affyPLM')

> library(affyPLM)

> library(CLL)

> data('CLLbatch')

> Pset <->

> image(CLLbatch[,1])#画原始芯片图

>image(Pset,type='weights',which=1,main='Weights')#画权重图

>image(Pset,type='resids',which=1,main='Residuals')#画残差图

>image(Pset,type='sign.resids',which=1,main='Residuals.sign')#画残差符号图

一般情况下,在权重图中,绿色代表较低的权重(接近0),白色代表较高的权重(接近1);在残差图中,红色代表正残差,白色代表低残差,蓝色代表负残差;在残差符合图中,红色代表正残差,蓝色代表负残差。左上图为原始图像,右上图为权重图,左下图为残差图,右下角为残差符号图

1

什么是RLE箱线图

相对对数表达(RLE)箱线图可以反映对照组和实验组之间,大部分基因的表达量是否保持一致,RLE定义为一个探针组在某个样品的表达值除以该探针组在所有样品中表达值的中位数后取对数,RLE箱线图中每个样品的中心应该非常接近纵坐标0的位置,如果个别样品与其他大多数明显不一样,说明可能这个样品有问题。

NUSE为何物?

NUSE比RLE更加敏感的质量检测手段。NUSE定义为一个探针组在某个样品的PM值的标准差除以该探针组在各样品中PM值标准差的中位数。质量可靠的样品,标准差十分接近,NUSE值接近1,反之偏离1的位置,有种极端情况,大多数芯片有质量问题,但是标准差十分接近,反而会显得没有质量问题,所以这时候,必须结合RLE与NUSE两个图进行可靠分析。

2

>source('http://www./biocLite.R')

> biocLite('RColorBrower')

> library(affyPLM)

> library(RColorBrewer)

> library(CLL)

> data('CLLbatch')

> Pset <->

> colors <->

>Mbox(Pset,ylin=c(-1,1),col=colors,main='RLE',las=3)#绘制RLE箱线图

>boxplot(Pset,ylim=c(0.95,1.22),col=colors,main='NUSE',las=3)#绘制NUSE箱线图

图中CLL1与CLL10的质量明显有别于其他样品,应舍弃。

3

RNA降解你听说过?

反正我是听说过,但是不会用。RNA降解是影响芯片数据质量的重要因素,RNA是从5端开始降解,理论上5端的荧光强度低于3端的荧光强度,降解曲线的斜率越小,说明降解的越少;反之越多。若斜率太小,甚至接近0,不代表没有降解,可能全部被降解

>source('http://www./biocLite.R')

> biocLite('affy')

> library(affy)

> library(RColorBrewer)

> library(CLL)

> data('CLLbatch')

> data.deg <->

> colors <->

> plotAffyRNAdeg(data.deg,col=colors)#绘制RNA降解图

>legend('topleft',rownames(pData(CLLbatch)),col=colors,lwd=1,inset = 0.05,cex=0.5)#在图的左上角添加图注

从图中可知,CLL3对应曲线几乎平行于横轴,可能严重降解,需要去除。CLL1与CLL10需去除

>CLLbatch<>


文/刘晓雪

图/刘晓雪


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多