转录组分析是目前应用最广的高通量测序分析技术之一。常见设计是不同样品之间比较,寻找差异基因、标志基因、协同变化基因、差异剪接和新转录本,并进行结果可视化、功能注释和网络分析等。 转录组的测序分析也相对成熟,从RNA提取、构建文库、上机测序再到结果解析既可以自己完成,又可以在专业公司进行。 概括来看转录组的分析流程比较简单, 但重点和难点在于理解这些过程都是怎么做的,有什么需要注意的,结果怎么解读,后续分析怎么做。这些只有自己动手操作过,才可能有理解。而理解了一个,再去做其它类型分析,也会轻松很多。 而且现在三代测序火起来了,该怎么去选择呢? 三代测序能帮我们解决什么问题,不能做什么,有什么需要注意的,分析起来有什么不同,二代-三代如何统一分析?也是我们面临的一个新问题。 实验设计这块重要的是对照和至少 另外一个需要注意的是测序的批次效应,保证自己的样品同时处理、RNA同时提取、同时构建文库和上机测序。这些环节虽然不能总受我们控制,但记录下对应的操作时间和批次,最后在绘制表达图谱时与实验相关参数进行 测序环节通常不需要自己操作,测序公司都很成熟,但测序的原理需要知道。这会影响到后续分析时参数的选择,比如知道什么是插入片段大小,什么是链特异性测序,什么情况会有接头序列,双端测序如何测等。 获得数据后,就涉及到数据的传输和质量评估(也包括如何从公共数据库下载数据)和文件格式的转换。FASTQ格式解释和质量评估中有些提及。质量评估的意义在于从测序质量角度评价建库和测序的成功与否,指导接头和低质量碱基的去除。这一步参数控制的严格与否对后续的比对会有影响,同时也会受到后续分析选择的工具的影响。对Linux系统一定程度的了解,是进行这些工作的基础。 39个转录组分析工具,120种组合评估(转录组分析工具哪家强)中讲述了如何选择、评估合适的比对工具,序列拼装工具,定量工具和差异分析工具。值得我们在进入正式的分析之前,仔细阅读。另外类似的评估文章,还有几篇,都可以一并读一下,这样在后期分析时对工具的选择和使用才更得心应手。 工具比较类文章一般只告诉你做了什么,不告诉你这么做的原因是什么,而且每一步细分开来又有很多小细节需要注意,比如在比对环节就会涉及到:不同的样本如何选择合适的基因组和注释文件,什么样的软件支持Junction reads的比对,什么样的比对率是合适的,比对质量怎样,测序中RNA有无降解或选择偏好性,测序饱和度如何等。 这些可能都不会体现在最终的结果中,但都是确保后期结果可靠性所必须要做的事情。2002年诺贝尔奖得主 在后面的差异基因鉴定阶段,还存在把 生信宝典团队经过紧张的筹备,决定推出一系列的针对生信学习和高通量分析的兴趣小组(在生信学习系列教程的基础上进一步拓展和深入),跟大家一起去走过这段历程。我们的口号是 但生信学习是个缓慢的过程,需要教、学、练、改不断的循环。我们希望能通过系列课程,再加上 课程简介一、转录组的应用、设计和案例分享
二、转录组分析流程实战
三、转录组高级分析
四、三代测序技术概述
五、三代测序基本分析流程
|
|