比对统计测序饱和度表示的是测序量与检测到的表达基因数量之间的关系,当测序量达到一定标准时,检测到的表达基因数量就逐渐趋近饱和。 cDNA片段随机性检验是通过比对到参考基因序列上的reads数量来进行评估的。由于不同的参考基因有不同的长度,因此对不同长度的参考基因做了均一化处理。reads在基因上分布均匀就标明cDNA片段的随机性好。 根据样品不同表达量对应的密度值做密度分布图。 基因表达丰度统计基因表达量的计算使用RPKM法(Reads Per Kb per Million reads){Mortazavi, 2008 #103},其计算公式为: 设RPKM(A)为基因A的表达量,则C为唯一比对到基因A的reads数,N为唯一比对到基因组的总reads数,L为基因A编码区的碱基数。RPKM法能消除基因长度和测序量差异对计算基因表达的影响,计算得到的基因表达量可直接用于比较不同样品间的基因表达差异。 结果示例
|
|
来自: zhuqiaoxiaoxue > 《生物信息学》