分享

发表在Nature Methods上的在线分析工具,是一个怎样的操作?

 九色枫林 2019-03-21

https://cibersort./

聊一个发表在26分杂志上的在线分析神器,此前白介素同学写过一期关于免疫浸润分析,数据挖掘新高度的推文。 这里是续集,数据挖掘新高度(二)

Step1准备数据

在数据分析之前首先需要准备好自己的数据格式,要求不能有缺失值,txt文档不能有双引号,建议数据不要经过log转换。

mixture文档,实际上就是要自己准备好一个表达矩阵,举个栗子如下:

第一个文件

特别注意一点是,数据格式对ID类型不作要求,唯一的要求是必须跟其它提供的文件ID是匹配的,这个还是比较容易做到的嘛。

第二个文件

可以自己输入Signature文件作为参考signature,如果自己准备就准备成下面框框的格式。 也可以选择它本身提供的 LM22 这个signature文件,但要强调的是 LM22仅仅在两个芯片平台上验证过,RNA-seq平台未验证,并且,如果用这个,必须保证你的Mixture文件的ID也用的HUGO。 

________________________________________

如果行自己上传 gene signature也是可行的,准备好 signature文件即可。 除此以外如果自己没有 gene signature的话,又不用它自带的 gene signature的话,也可以用,这时就要提供下面两个文件,利用这个数据库来产生 gene signature:

还需要一个 phenotype的文件,格式如下:

Step2-上传文件 and Run

下面我们来上传一个数据分析下试试看,上传一个mixture文件,格式如下:

需要几分钟的时间处理,然后就可以在结果部分看到,行为sample名,列为免疫浸润分数。

还有另外一个图:

除此之外呢,提供所有,分析结果的 CSV, pdf等格式的数据下载,这样就方便大家自己去下载,然后按照自己的要求绘制其它图形,得到的重要结果就是免疫浸润分数。

聊一聊这个免疫浸润分析工具的来头,该数据库由斯坦福大学医学院的研究团队开发的,相关论文2015年发表在 Nature Methods杂志上,截止目前的引用量为645次。

这个工具其实在此前白介素同学撰写的[肿瘤免疫浸润分析工具汇总]一文中有提到过,上次还做了标注。跟此前介绍的 TIMER 数据库(https://cistrome./timer/)相比呢,在使用的友好程度上没有那么高,但是引用次数更高。

需要注册,比较麻烦。而且教程不够完善,个人认为教程讲的不是很清楚,对新手而言要使用需要一定的学习成本。另外就是可视化程度不够高,而TIMER的美图,确实是超酷啊。不过既然发表的论文在高级的杂志,可能在算法层面有自己的优越性吧,这个就超出白介素同学能力范围了,这里不作评价了。至于究竟使用哪个,还是需要看大家自己的需求哈,反正都是可靠的!

好了,这是白介素同学自己探索这个分析工具的所得基本就是这些啦,探索的过程比较曲折,还是分享给大家。

参考文献:

https://www./articles/nmeth.3337

网址:

https://cibersort./

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多