TCGA分析神器 闭关学习TCGA,想用R语言直接下载TGCA数据库RNA-Seq、基因芯片数据等,不给力的电脑,运行速度太慢,还是建议想搞编程的同学,起码电脑内存8G,200G以上,当然懒人有懒人的处理办法,毕竟目前很多软件都是懒人开发的。TCPA你值得拥有!http://www./tcpa/ 点击链接,进入主要界面,主要有四个部分,summary、My protein、Visualization、Analysis Summary里面主要讲了本软件涉及的数据集,主要是TCGA中的蛋白芯片数据和一些细胞系数据,点击右边的show按钮可以显示特定数据集中的信息概要,比如点击BRCA show可以查看BRCA的详细信息 My protein主要展示一些蛋白Marker,同时可以看到一些抗体的信息和货号、来源等信息。 点击Visualization,可以看到两个界面Network Visualization和Heatmap Visualization两个部分。Network Visualization进入后,点击select a data set,可选择TCGA Breast invasive carcinoma(BRCA)(901samples),点击show,显示蛋白共表达网络,可以看到下图结果,红色表示正相关,绿色表示负相关。 点击Heatmap,进入后选择数据集,比如TCGA Breast invasive carcinoma(BRCA)(901samples),点击show,显示热图,见下图 选择K=3热图后,显示BRCA乳腺癌热图数据,见下图:可通过滚动鼠标对图进行放大缩小 Analysis一栏最为重要,里面的图完全可以放在文章第一部分来完善逻辑环。包含三个分析模块,相关性分析(Correlation),差异分析(Differential)和生存分析(Survival)。Correlation模块展示肿瘤样本中(以乳腺癌为例)分子表达相关性,按皮尔逊系数从大到小排列,点击可以看到该分子的散点图。Differential模块用处不大,只能分析两种肿瘤组织之间表达差异,比较结肠癌和乳腺癌。Survival模块按Log-Rank p值从小到大排列了蛋白表达量与生存率之间的关系,红色代表高表达组,蓝色代表低表达组 相关性分析(Correlation) 差异分析(Differential)-结肠癌VS乳腺癌 生存分析(Survival) 红色表示高表达组,蓝色表示低表达组 图/文/编辑/ 刘晓雪 ![]()
|
|