▲▲▲ 今天小诺要给大家隆重介绍一个肿瘤表型转录数据门户网站: CRN(Cancer RNA-Seq Nexus)数据库 ★ http://syslab4./ ★ 这个数据库收录了来自于The Cancer Genome Atlas (TCGA), Sequence Read Archive (SRA) 和 NCBI Gene Expression Omnibus (GEO) 合计89个肿瘤数据集12,167个样品的转录组数据,并且每个肿瘤样品都有对应表型信息(如TNM分型、grade高低、分子分型等),以便于大家针对同一肿瘤不同分型之间进行比较。网站主要包括了三个模块:不同分组差异表达比较、共表达调控网络分析、候选基因表达量查询,下面小诺给大家逐一介绍每个功能模块。 ▼▼▼
左侧是各种肿瘤类型和收录的数据集情况,每个数据集会包括不同类型的样品,如方框1里面的乳腺癌数据集包括了细胞系、ER阳性病人癌组织、ER阳性病人正常组织、三阴病人正常组织、三阴病人癌组织等样品类型。方框2是具体的比较方案,如我们选定了其中一种标本类型(如TNBC),则会显示它与其他类型标本两两的比较方案,之后我们按照需求点击其中一种即可。右侧方框3里面会显示差异的mRNA情况,如组内表达量平均水平、差异倍数、显著性、对应的基因名字等,最右侧还提供基于表达量信息的热图,以便大家最直观的看到差异表达情况。除了mRNA外还提供lncRNA的差异表达信息,具体点击DE lncRNAs按钮即可,展示方式和mRNA的基本一致。 此外,还能选择只看上调还是下调的基因,或者两者都选择。如果候选基因太多还能按照P-value显著性进行筛选,以便于寻找到最显著的差异基因进行后续的研究,分析的结果和热图还能直接下载到本地以供编辑。CRN上不同的数据集会存在同一类型标本的比较方案,基于不同数据集进行独立分析后寻找两者之间共性的部分,可以直接筛选出更加可靠的差异结果,在CRN网站上连独立验证的工作都可以直接完成了,实现真正意义的一站式服务。
CRN一次可以提供mRNA和lncRNA等两种不同类型的RNA表达量信息,这些信息需要有效的整合才能为课题所用,所以这个网站还提供运用生物信息学预测方法整合数据得到的共表达调控网络结果。大家只要在Gene和lncRNA上分别输入关注的基因和lncRNA即可,然后就可以直接构建出相应的调控网络,蓝色代表差异表达的mRNA,红色代表差异表达的lncRNA,基因之间绿色的线代表两者之间正相关(起促进作用),红色的线代表两者之间负相关(起抑制作用),基于这张调控网络图我们就可以清晰了解到差异基因之间的具体关系,为后续功能学验证提供指导。
用户可以直接搜索候选基因的表达情况,对于不确定基因名字的,网站可以根据关键字进行自动补全搜索,然后自动显示候选基因的表达情况和热图信息。
|
|