分享

bioconductor系列教程之一分析基因芯片中(质量控制) – 第6页 – 糗世界

 ky之路 2020-08-13

使用FitPLM生成权重,残差及NUSE图像

使用simpleAffy对基因芯片质量所做出的评估都是基于平均值的,它有一个默认的假设,那就是对于每一块芯片,质量是均匀的,不会因在同一块芯片内部还随着位置的不同而质量发生较大的变化。但事实上往往不是这样。如果我们把芯片划分成许多小格的话,我们会发现格与格之间的质量也是有差异的,这可能是由于芯片印刷的问题,也可能是杂交过程出现的问题,导致了同一块芯片也出现质量不均匀的情况。这种对待芯片的态度,就好象MAS5和RMA之间的差别。

为此,我们导入affyPLM库。这个库会基于RMA算法来对数据进行预处理,然后给出与质量控制相关的直观图像。

> library(affyPLM)
Loading required package: preprocessCore

Attaching package: 'affyPLM'

The following object(s) are masked from 'package:stats':

    resid, residuals, weights

> Pset <- fitPLM(Data) 
> x11()
> par(mfrow=c(2,2))
> image(Data[,2]);image(Pset,type="weights",which=2,main="Weights");
> image(Pset, type="resids", which=2, main="Residuals");
> image(Pset, type="sign.resids", which=2, main="Residuals sign");

什么是所谓的权重(weight)呢?什么是残差呢(residuals)?如何看懂权重残差图呢?首先我们要了解的是affyPLM库在探针水平(probe-level-model)拟合时所使用的回归方法是最小二乘法,而普通最小二乘法假设误差项的方差是不变的。然而,在基因芯片的应用计算过程中,这一假设是不成立 的。所以引入了加权最小二乘法来进行回归。而这个权重呢,就体现着这种方差的变化。残差就是指期待值和观测值 之间的差异。因为所有的探针都是随机分布在基因芯片上的,所以我们应该期待权重和残差的分布也应该是随机的。具体到权重残差图片中来,一般的,在权重图中,绿色代表较低的权重(接近0),白色、灰色代表较高的权重(接近1);在残差图中,红色代表正的高残差,白色代表低残差,蓝色代表负残差。而sign.resids图使用红色表达正的残差,蓝色表达负的残差。因为我们期待权重和残差都是随机分布的,所以我们应该看到的是绿色均匀分布的权重图,或者红蓝均匀分布的残差图。示例的图片中,我们可以看到在一定程度上芯片的右侧有部分权重及残差分布并不均匀。我们也会注意到,图中会出现一些白色的条块,这是正常的现象,因为有些时候,探什会按照GC比排布从布导致白斑的出现。

Figure 2权重及残差图
Figure 2权重及残差图

在同一组实验中,即使是相互比较的对照组与实验组之间,大部分基因的表达量还是应该保持一致的,何况平行实验之间。当我们使用相对对数表达(Relative Log (RLE))的的箱线图来控制不同组之间的实验质量时,我们会期待箱线图应该在垂直中央相类的位置(通常非常接近0)。如果有一个芯片的表现和其它的平行组都很不同,那说明它可能出现了质量问题。

为了使图的颜色好区别,我们使用RColorBrewer库来直接调用R为我们准备好的颜色组。

> library(RColorBrewer)
> colors <- brewer.pal(12,"Set3") 
> x11()
> Mbox(Pset, ylim = c(-1,1), col=colors,main="RLE")
Figure 3相对对数表达箱线图
Figure 3相对对数表达箱线图

相对标准差(Normalized Unscaled Standard Errors(NUSE))是一种比RLE更为敏感 的质量检测手段。如果你在RLE图当中对某组芯片的质量表示怀疑,那当你使用NUSE图时,这种怀疑就很容易被确定下来。NUSE的计算其实也很简单,它是某芯片基因标准差相对于全组标准差的比值。我们期待全组芯片都是质量可靠的话,那么,它们的标准差会十分接近,于是它们的NUSE值就会都在1左右。然而,如果有实验芯片质量有问题的话,它就会严重的偏离1,进而影响其它芯片的NUSE值偏向相反的方向。当然,还有一种非常极端的情况,那就是大部分芯片都有质量问题,但是它们的标准差却比较接近,反而会显得没有质量问题的芯片的NUSE值会明显偏离1,所以我们必须结合RLE及NUSE两个图来得出正确的结论。

> boxplot(Pset, ylim= c(0.95, 1.20), col=colors, main="NUSE")
Figure 4相对标准差箱线图
Figure 4相对标准差箱线图

赞过:

赞 正在加载……
Pages: 1 2 3 4 5 6 7 8 9

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多