ASprofile是一款识别可变剪切事件的软件,该软件可以直接将同一个基因的多个转录本进行比较,从而鉴定可变剪切事件,官网如下
该软件安装比较简单,下载解压缩即可。基本用法如下 extract-as transcript.gtf ref.fa.hdrs > as_events.txt 该脚本需要两个参数,第一个参数为转录本对应的 >chr1 /len=249250621 /nonNlen=225280621 /org=Homo_Sapiens(hg19)
>chr2 /len=243199373 /nonNlen=238204518 /org=Homo_Sapiens(hg19)
>chr3 /len=198022430 /nonNlen=194797135 /org=Homo_Sapiens(hg19) 每一行代表一条染色体,分别给出总长度,去除N碱基之后的长度以及物种信息。最后生成的文件中会给出不同可变剪切事件的详细结果。Asprofile中的可变剪切类型定义如下 1. 外显子跳跃外显子跳跃的定义如下 分别用 单个外显子跳跃称之为exon skipping, 用
2. 内含子保留内含子保留的定义如下 分别用 单个内含子保留称之为retention of single intron, 用 多个内含子保留称之为retention of multiple introns,用 3. 外显子替换外显子替换称之为alternative exon, 用 包含各种情况,比如exon的5’端不变,3’端发生变化,示意如下 exon的3’端不变,5’端发生变化,示意如下
4. 转录起始位点的替换转录起始位点的替换称之为alternative transcript start, 用 5. 转录终止位点的替换转录起始位点的替换称之为alternative transcript termination, 用 上述文件中可变剪切事件是以转录本为单位进行展示的,每行代表一个转录本,存在冗余,当我们想要知道某个基因上发生的可变剪切的类型和数量时,该文件就不够直观,官方提供了 perl summarize_as.pl transcript.gtf as.events.txt -p prefix 该脚本会生成两个文件,后缀为 通过 perl collect_fpkm.pl sampleA.AS,sampleB.AS -s txt 多个样本用逗号连接, ·end· |
|