转录组测序及分析技术可以解决新基因的深度发掘、低丰度转录本的发现、转录图谱绘制、可变剪接的调控、代谢途径确定、基因家族鉴定及进化分析等各方面的问题;成为了广大科研工作者备受青睐的高通量测序技术之一。转录组研究的应用领域十分广泛,适合研究组织特异性的、不同生长发育的、逆境胁迫下的、侵染转基因的、性状突变等材料。转录组是在某一特定发育时期或某一生理条件下,细胞或组织内所有转录产物的集合,包括mRNA、lncRNA、small RNA、circle RNA等。因此做转录组测序理论上可以研究各种长度范围的RNA序列,目前的常规技术包括mRNA测序、lncRNA测序、smallRNA测序。 (1)mRNA:可以通过富集polyA的方式来调取mRNA,进行建库测序; (2)lncRNA或lncRNA+mRNA:可以通过去rRNA试剂盒去除rRNA后进行建库测序;(3)circle RNA:可以通过消化线性RNA,再去除rRNA后进行建库测序;(4)small RNA:采用sRNA的建库策略,对18-40nt范围的sRNA进行切胶富集后建库测序。(1)了解不同样品间基因或sRNA的表达差异:选择SE(single end)测序即可,测序量10M reads以上; (2)进行基因的可变剪切、挖掘新基因、对现有基因的注释进行优化、检测基因融合等结构方面的分析:选择PE(pair end)测序,测序量则根据物种基因集合的大小来决定。(1)RNA-seq denovo:基于序列组装,用于从头构建某物种的转录本序列;(2)RNA-seq resequencing:对于已有参考基因的物种,进行基因定量、基因可变剪切、基因融合、新基因检测等分析;(3)lncRNA-sequencing:主要研究lncRNA的表达量,预测新的lncRNA及其功能;(4)sRNA sequencing:主要研究和分析small RNA序列,特别是miRNA的表达情况,并预测novel miRNA,miRNA靶基因分析等。 分析流程(点击可查看大图)(1)数据质控:如果clean data 比例过低则测序不合格。(2)比对统计:如果与基因组、基因集比对率过低则可能因为:①样本污染严重,导致测序混入其它物种序列;②提供的数据库组装和注释结果较差或是近源种差异过大,导致比对率偏低。(3)定量和差异分析:样本比对可以是单样本比对,也可以是组建比对。(4)GO富集分析:纵坐标为富集的GO Term,横坐标为该GO Term中差异基因个数。不同颜色用来区分生物过程、细胞组分和分子功能,带*为显著富集的GO Term图。(5)Pathway富集分析:纵坐标表示Pathway条目,横坐标表示Rich factor;点表示显著差异表达基因数,点的大小表示显著差异表达的基因数目越多。不同颜色的点表示不同的Qvalue值。 (7)新转录本预测:第1列为转录本ID;第二列为Gene ID;第三列为转录本所在的染色体;第四列为转录本所在染色体的链信息;第五列为转录本的外显子数目;第六列为每个外显子的大小(多个用逗号分隔);第八列为该转录本在所用样品中的表达量值;最后两列分别为CNCI预测给出的分类(coding和non-coding)和CNCI预测给出的分值。(8)AS分析:横坐标表示可变剪切事件,纵坐标表示基因数目或者可变剪切事件数目。每个样品代表一行。 分析流程(点击可查看大图)(2)组装完整性评估:组装完整性是衡量转录本组装结果好坏的重要指标。将组装得到的转录本与最近缘的物种CDS序列进行比对,从整体水平上来评估转录本组装的完整性。 A.横坐标表示转录本的覆盖深度,纵坐标表示与近缘物种同源基因的长度之比;B.横坐标表示同源基因序列的长度,纵坐标表示与近缘物种同源基因的长度之比。
lncRNA 指长度≥200nt 的非编码 RNA。哺乳动物基因组序列中约 5%-10%被稳定转录,其中蛋白质编码基因仅约占 1%,其余 4%-9%的序列都转录为ncRNA。近年来的研究表明,LncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程,该研究已成为遗传研究热点。 (1)lncRNA筛选与鉴定 (2)cis作用靶基因预测:lncRNA的功能与其坐标临近的编码蛋白基因相关,于是将lncRNA基因临近的(上下游10k/100k)蛋白编码的基因找出进行功能富集分析,以推测lncRNA的主要功能。(3)trans作用靶基因预测:lncRNA的功能与样品中共表达的编码蛋白基因相关,可以通过样本间lncRNA与蛋白编码基因的相关性分析或共表达分析来预测。Small RNA 测序技术则是借助第二代高通量测序技术,对某物种某组织在特定状态下的18-30 nt(或18-40 nt)的small RNA 进行高通量测序。继而通过数据库比对,对获得的smallRNA 序列进行分析、鉴定,将数百万条small RNA 序列分类成rRNA、tRNA、snRNA、snoRNA和miRNA等。
|