迷途的飞翔 / 测序 / 干货整理 | 转录组测序和分析,你需要知道...

分享

   

干货整理 | 转录组测序和分析,你需要知道的

2016-10-28  迷途的飞翔
转录组测序及分析技术可以解决新基因的深度发掘、低丰度转录本的发现、转录图谱绘制、可变剪接的调控、代谢途径确定、基因家族鉴定及进化分析等各方面的问题;成为了广大科研工作者备受青睐的高通量测序技术之一。

转录组研究的应用领域十分广泛,适合研究组织特异性的、不同生长发育的、逆境胁迫下的、侵染转基因的、性状突变等材料。
转录组是在某一特定发育时期或某一生理条件下,细胞或组织内所有转录产物的集合,包括mRNA、lncRNA、small RNA、circle RNA等。因此做转录组测序理论上可以研究各种长度范围的RNA序列,目前的常规技术包括mRNA测序、lncRNA测序、smallRNA测序。

那么问题来了,研究转录组如何下手?

1
根据研究对象,选择相应的建库策略
(1)mRNA:可以通过富集polyA的方式来调取mRNA,进行建库测序;

(2)lncRNA或lncRNA+mRNA:可以通过去rRNA试剂盒去除rRNA后进行建库测序;

(3)circle RNA:可以通过消化线性RNA,再去除rRNA后进行建库测序;

(4)small RNA:采用sRNA的建库策略,对18-40nt范围的sRNA进行切胶富集后建库测序。

2
根据研究目的,选择不同的测序策略
(1)了解不同样品间基因或sRNA的表达差异:选择SE(single end)测序即可,测序量10M reads以上;

(2)进行基因的可变剪切、挖掘新基因、对现有基因的注释进行优化、检测基因融合等结构方面的分析:选择PE(pair end)测序,测序量则根据物种基因集合的大小来决定。

3
基于转录组测序的主流研究手段
(1)RNA-seq denovo:基于序列组装,用于从头构建某物种的转录本序列;

(2)RNA-seq resequencing:对于已有参考基因的物种,进行基因定量、基因可变剪切、基因融合、新基因检测等分析;

(3)lncRNA-sequencing:主要研究lncRNA的表达量,预测新的lncRNA及其功能;

(4)sRNA sequencing:主要研究和分析small RNA序列,特别是miRNA的表达情况,并预测novel miRNA,miRNA靶基因分析等。

4
有参转录组的分析流程&分析内容

分析流程(点击可查看大图)
(1)数据质控:如果clean data 比例过低则测序不合格。

(2)比对统计:如果与基因组、基因集比对率过低则可能因为:①样本污染严重,导致测序混入其它物种序列;②提供的数据库组装和注释结果较差或是近源种差异过大,导致比对率偏低。

(3)定量和差异分析:样本比对可以是单样本比对,也可以是组建比对。

(4)GO富集分析:纵坐标为富集的GO Term,横坐标为该GO Term中差异基因个数。不同颜色用来区分生物过程、细胞组分和分子功能,带*为显著富集的GO Term图。

(5)Pathway富集分析:纵坐标表示Pathway条目,横坐标表示Rich factor;点表示显著差异表达基因数,点的大小表示显著差异表达的基因数目越多。不同颜色的点表示不同的Qvalue值。
(6)聚类分析

(7)新转录本预测:第1列为转录本ID;第二列为Gene ID;第三列为转录本所在的染色体;第四列为转录本所在染色体的链信息;第五列为转录本的外显子数目;第六列为每个外显子的大小(多个用逗号分隔);第八列为该转录本在所用样品中的表达量值;最后两列分别为CNCI预测给出的分类(coding和non-coding)和CNCI预测给出的分值。

(8)AS分析:横坐标表示可变剪切事件,纵坐标表示基因数目或者可变剪切事件数目。每个样品代表一行。
(9)SNP分析

5
无参转录组分析流程&分析内容

分析流程(点击可查看大图)

(1)组装结果统计

(2)组装完整性评估:组装完整性是衡量转录本组装结果好坏的重要指标。将组装得到的转录本与最近缘的物种CDS序列进行比对,从整体水平上来评估转录本组装的完整性。


A.横坐标表示转录本的覆盖深度,纵坐标表示与近缘物种同源基因的长度之比;B.横坐标表示同源基因序列的长度,纵坐标表示与近缘物种同源基因的长度之比。


(3)转录本注释

6
lncRNA分析内容

lncRNA 指长度≥200nt 的非编码 RNA。哺乳动物基因组序列中约 5%-10%被稳定转录,其中蛋白质编码基因仅约占 1%,其余 4%-9%的序列都转录为ncRNA。近年来的研究表明,LncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程,该研究已成为遗传研究热点。

(1)lncRNA筛选与鉴定

(2)cis作用靶基因预测:lncRNA的功能与其坐标临近的编码蛋白基因相关,于是将lncRNA基因临近的(上下游10k/100k)蛋白编码的基因找出进行功能富集分析,以推测lncRNA的主要功能。

(3)trans作用靶基因预测:lncRNA的功能与样品中共表达的编码蛋白基因相关,可以通过样本间lncRNA与蛋白编码基因的相关性分析或共表达分析来预测。
7
miRNA分析流程&分析内容
Small RNA 测序技术则是借助第二代高通量测序技术,对某物种某组织在特定状态下的18-30 nt(或18-40 nt)的small RNA 进行高通量测序。继而通过数据库比对,对获得的smallRNA 序列进行分析、鉴定,将数百万条small RNA 序列分类成rRNA、tRNA、snRNA、snoRNA和miRNA等。

(1)样本长度统计
(2)差异分析

(3)靶基因预测


基因帮2.0 即将上线

专业生物信息平台

提供可选择的测序及分析方案

测序:华大、诺禾等一线实力测序服务商

分析:各级别工程师,标准化、个性化、定制化分析

明码标价,质量保证

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多
    喜欢该文的人也喜欢 更多

    ×
    ×

    ¥.00

    微信或支付宝扫码支付:

    开通即同意《个图VIP服务协议》

    全部>>