分享

基因表达丰度

 zhuqiaoxiaoxue 2015-07-21

比对统计

测序饱和度表示的是测序量与检测到的表达基因数量之间的关系,当测序量达到一定标准时,检测到的表达基因数量就逐渐趋近饱和。

cDNA片段随机性检验是通过比对到参考基因序列上的reads数量来进行评估的。由于不同的参考基因有不同的长度,因此对不同长度的参考基因做了均一化处理。reads在基因上分布均匀就标明cDNA片段的随机性好。

根据样品不同表达量对应的密度值做密度分布图。

基因表达丰度统计

基因表达量的计算使用RPKM法(Reads Per Kb per Million reads){Mortazavi, 2008 #103},其计算公式为:

设RPKM(A)为基因A的表达量,则C为唯一比对到基因A的reads数,N为唯一比对到基因组的总reads数,L为基因A编码区的碱基数。RPKM法能消除基因长度和测序量差异对计算基因表达的影响,计算得到的基因表达量可直接用于比较不同样品间的基因表达差异。

结果示例

Gene_ID Length RPKM Count
ENSSSCG00000000001 1551 0.381569 3
ENSSSCG00000000002 2157 40.5386 462
ENSSSCG00000000003 1410 6.25005 44
基因的ID 基因的有效长度 RPKM值 比对到基因上的reads数

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多