分享

使用circRNA_finder识别环状RNA

 生信修炼手册 2019-12-24

circRNA_finder是一款环状RNA预测软件,在对果蝇的研究中采用该软件进行了环状RNA的预测,该软件的源代码托管在github上,网址如下

https://github.com/orzechoj/circRNA_finder

软件的安装比较简便,直接下载解压就可以了,需要注意的是,该软件依赖以下几个软件

  1. perl

  2. awk

  3. STAR

  4. samtools

其中samtools的版本必须是低于1.0的版本,因为两个版本samtools sort的用法有变化。软件的使用包含如下两个步骤

1. STAR比对参考基因组

STAR是一款转录组数据的比对软件,其支持嵌合体的比对方式,也就是说支持一条reads的两个部分比对到不同的基因组区域,而环状RNA的junction reads就是符合这样的要求,代码如下

STAR --genomeDir hg19_star_db/ --readFilesCommand gunzip -c --readFilesIn R1.fastq.gz R2.fastq.gz --runThreadN 4 --chimSegmentMin 20 --chimScoreMin 1 --alignIntronMax 500000 --outFilterMismatchNmax 4 --alignTranscriptsPerReadNmax 100000 --twopassMode Basic --outSAMtype BAM SortedByCoordinate --chimOutType SeparateSAMold --outFilterMultimapNmax 2 --outFileNamePrefix C1

虽然软件提供了一个名为runStar.pl的脚本,但是由于STAR的版本问题,使用起来并不方便。该脚本本质上是对STAR的封装,直接用STAR就好了,参数设置可以参考脚本中的设置。

2.  运行circRNA_finder

第二步就是预测环状RNA,代码如下

perl postProcessStarAlignment.pl --starDir star_out_dir --minLen 100 --outDir output_dir

运行完成之后,会三个文件,对应的后缀如下所示

  1. _filteredJunctions.bed

  2. _s_filteredJunctions.bed

  3. _s_filteredJunctions_fw.bed

第一个文件为所有环状RNA的结果文件;第二个文件为剪切位点符合GT-AG剪切信号的环状RNA;第三个文件和第二个文件的环状RNA相同,只不过新增了环状RNA连接点附近的线性RNA平均测序深度信息。通常情况下,我们选择第二个文件的结果作为最终的环状RNA预测结果,该文件内容示意如下

每一行代表一个环状RNA,第一列代表染色体编号,第二列和第三列分别代表起始和终止位置,第四列代表name,这里用数字编号加上字母s表示,第五列代表环状RNA的junction reads数目,也就是表达量,第六列代表正负链信息。

·end·

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多