分享

内测开始 | IGV-GSAman: 人工矫正基因注释神器!欢迎参与~

 生信药丸 2022-10-05 发布于贵州

写在前面

国庆开始,想着做点想做但平时没时间做的事情,也不辜负长假。于是,再再再再再一次下决定,试试看到底能不能按照自己的想法,写一个 IGV 的自定义 Track。当然,现在往回看,肯定是可以。前两天,也推出了 「IGV-GSAman」的「Alpha」版本,基本功能不多,不过都是一些关键逻辑的实现测试,包括:

  1. 鼠标直接拖拽修改注释

  2. 直接复制 CDS 序列

  3. 导出修改后的注释为 GFF3 文件

原本想着就这样吧,假期也没白费了。但推文推出,说是直接取代了以前的「IGV-GSAme」,不少朋友还是感兴趣。收到几个邮件,也有三四位间接联系过来。于是想着,这下不对外释放似乎也不太合适,毕竟东西都写出来了。能够加速不少人的科研工作,也是微薄贡献。
既然要释放,那么还是要把必备的功能,补充一下。于是又挤了挤时间,补充了不少功能,大体如下

完善特性

一番折腾,基本覆盖了之前「IGV-GSAme」的所有功能,而现在的「IGV-GSAman」功能更全,更稳健,后面优化空间更大。
Copy CDS Sequence,右键可以直接复制整个mRNA转录本对应的全长 CDS,方便后续分析

Copy mRNA Sequence,右键直接复制mRNA序列全长
Delete this Transcript,删除鼠标点击的转录本,注意到,如果是最后一个转录本,那么会自动清理掉对应基因

Add a Transcript,在鼠标点击位置,增加一个新的转录本(会自定补充一个Exon),注意到添加的不会有链性

我们可以手动拖拽,参考任何信息,得到某个合适的外显子

Slice this Exon/Add a Exon,把鼠标点击的 Exon 切成两份,从某个角度来说,等同于增加了一个外显子

继续拖动拖拽,然后就可以得到合适的结果(一般是参考RNAseq mapping结果)

Predict CDS,预测鼠标点击的转录本最长开放阅读框为 CDS,注意到,如果已有CDS,会为自动清理掉;整个mRNA的链方向会按照预测出来的 CDS 自动校准。

当然,如果是基于RNAseq Mapping结果,会觉得更好看一些
Delete this Exon,删掉鼠标点击的 Exon,注意到,如果是最后一个外显子,那么会自动清理掉对应转录本(如果是最后一个转录本,会自动清理掉对应基因)
Switch Strand,切换链方向,比如一个转录本是正链,现在认为他是负链,那就切换一下。或许是个lncRNA,可以指定一下链。注意,如果有CDS存在,那么切换链时,CDS会自动清理掉。这个合理。
Clear CDS,去掉当前转录本的 CDS 注释,比如你做的就是一个 lncRNA
Softberry Predict,自动解析Softberry基因预测结果,谁用谁后悔,后悔没早用!(注意到,微小外显子一般是需要参数调优,当然,最好是基于 RNAseq Data 手动校准)

Export to GFF3 File,导出注释为 GFF3 文件,需要注意,不管你导出不导出,只要做了修改的注释,就已经修改而且保存了。你想撤回,那么后面会优化。而如果你希望软件突然崩溃退出,丢失数据,那这个办不到。逻辑上,是实时保存了。我想这个很重要,相比于 IGV-GSAme,IGV-GSAman的这点,我实在太喜欢 了。

写在最后

逻辑上,对于一个 GUI 软件,写图文教程是很麻烦的。简单写一下就好,或许后面有时间,直接录制一个视频讲演,这样会清晰一下。我们讨论了下,开始「IGV-GSAman」的内测,建立「内测微信群」,实施:

  1. 邀请制,由我们直接邀请进群

  2. 实名制,进群后需要标注「单位-姓名」

如果没有加我们微信的,可加师弟「刘鸿森」微信「sen1019san」,他会邀请你进群。欢迎确实有人工矫正基因注释需求或者有相关经验的朋友参与。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多