分享

1分钟内找出人类的转录因子敲除后的基因表达谱(KnockTF数据库)

 智汇基因 2021-02-18

转录因子(Transcription Factor, TF)及其靶基因在人类疾病和生物学过程中起重要作用,转录因子敲降/敲除前后的基因表达谱分析是获得转录因子靶基因、探索转录因子功能的最重要策略之一。

KnockTF是人的全面基因表达谱TF/基因敲除数据库,它提供了大量与转录因子敲降/敲除相关的人类基因表达谱数据集、转录因子及其靶基因的注释信息、转录因子的上游通路信息和下游靶基因的功能注释信息,以及转录因子绑定到靶基因启动子、增强子和超级增强子的详细绑定信息。

KnockTF

http://www./KnockTF/

接下来,展示如何使用KnockTF:


1、Browse


当我们不知道一个数据有什么、可以拿来做什么的时候,最好的方法就是查看浏览区,因为容易在这迸发灵感。

可以看到:Browse页面被设计成一个交互式表格,方便我们快速搜索TF基因敲除/剔除数据集,还可以通过使用“Data Source”,“Biosample Type”,“组织类型”,“ Tissue Type”和“Tissue Type ”来自定义筛选。

要查看给定的TF敲除/敲除数据集的详细信息,单击Dataset ID即可,这里我们点击DataSet_01_001,返回结果包括六个内容,如下:

①TF Overview

TF概述,左边包括了转录因子的名称,敲法,目标序列,转录因子的类别,生物样品名称、生物样品类型以及相关ID,和上面的表格展示内容区别不大,多了一些内容。右边是转录因子与目标基因网络图,每个圆形点点都意味着不同的转录因子。

② Target Gene Information of ESR1

这部分会展示ESR1的靶基因信息,包括Target Gene、TF、Mean、Expr. Of Control、Mean、Expr.of Treat、Fold ChangeLog2FC、Rank等,支持表格内容搜索。

解释一下,这里包括了所有差异基因的结果。默认排序是按照logFC的绝对值进行排序。由于是敲减的表达谱,变化的基因不一定是受到这个转录因子的影响,也可能是这个转录因子影响别的基因进而影响这个基因变化的。所以为了明确是不是收到这个基因的影响这个数据库也预测了相关基因启动区、超级增强子区、普通增强子区的可能结合的转录因子。

③ Function Analysis of Downstream Target Genes of ESR1

这里会展示ESR1下游靶基因的功能分析并提供下载。比如基因集富集分析GSEA,上调途径和下调途径都是以表格展示,也支持全局图的查看,如下:

还有基因本体论GO富集,KEGG途径富集。

④ Upstream Pathway Annotation of ESR1

ESR1的上游通道注释,数据基于ComPAT数据库。

⑤ Target Gene Expression Analysis

展示靶基因表达分析:

⑥ Expression Atlas of ESR1

这里提供的ESR1表达图谱很多,用来展示ESR1在不同组织当中的表达情况,有GTEx、CCLE、TCGA 、encode cell line。

好了,KnockTF展示的内容介绍到这里,我们接下来进入第二部分--SEARCH,搜索自己感兴趣的转录因子相关内容吧!


2 Search


点击导航栏里面可以看到,KnockTF支持四种不同的搜索模式:“按TF转录因子搜索”,“按靶基因搜索”,“按敲除方法搜索”和“按组织类型搜索”。这里解释一种搜索板块, Search by TF。

我们点击 Search by TF,以搜索转录因子为例AGO1为例进行示范:

在进行搜索前一次输入TF名称、TF Class、TF Superclass,点击search即可,右边条形图展示的是TF Superclassde 的构成。

结果在下一页以表格形式显示。

结果条数少,但是类目多。包括数据集ID,TF,敲除方法,生物样品类型,组织类型,生物样品名称,档案ID,平台,对照数,治疗数和公开ID。我们可以单击“数据集ID”以查看有关每个TF组合式/剔除数据集的详细信息。

搜索结果页面显示了TF概述,TF靶基因网络,靶基因信息,TF的上游途径注释以及下游靶基因的各种功能注释和分析结果,包括基因集富集分析(GSEA),基因本体论(GO)富集,KEGG途径富集,层次聚类分析和差异表达分析。这个和浏览模块所看到的内容是一致的,我们可以点击DataSet_02_095查看:


3 Analysis


Analysis有两种分析功能,一个是Subnetwork Analysis,TF Enrichment

①Subnetwork Analysis

Subnetwork Analysis,子网分析。我们可以用来提交基因列表来定位转录调控子网络。

我们输入KRT4、UPK1A、GABBR2、GPNMB、PSCA,点击提交后的效果如下:

子网络由提交的基因及其在TF差异表达基因网络中的单步邻居组成。ChIP-seq数据支持的TF-target关系由子网中的粗线表示。我们可以通过鼠标控制要显示的子网大小。

KnockTF还提供子网络基因的拓扑特征,包括程度,中间性和紧密性,如下:

②TF富集

这里可以提交基因列表并设置(FDR调整后的)P值以进行TF富集。KnockTF会将提交的基因映射到TF-DEG网络,并在提交的基因与每个TF调节的所有DEG之间执行超几何测试。

这里我们选择EXample基因作为演示,结果如下:

在(FDR调整后)P值,在用户集阈值以下的TF被认为是显着调节提交基因的最重要TF,比如这里的ESR1,P=1.53e-97。

还可以查看基因的维恩图:

在Download,KnockTF提供了增强子区域以及目标基因的相应TF结合信息,也支持导出每个搜索结果页面的查询结果。

经过今天的介绍,相信大家对KnockTF了解更多了。KnockTF不仅提供有关感兴趣的TF靶基因的全面基因表达信息,而且还收集TF的上游途径信息以及下游靶基因的各种功能注释和分析结果,包括GSEA,GO富集,KEGG途径富集,层次聚类分析和差异表达分析。KnockTF还提供了有关TF与靶基因的启动子,超级增强子和典型增强子结合的详细信息,以及可以将其用于对感兴趣的基因集进行网络分析。

Research:

Feng C, Song C, Liu Y, Qian F, Gao Y, Ning Z, Wang Q, Jiang Y, Li Y, Li M, Chen J, Zhang J, Li C. KnockTF: a comprehensive human gene expression profile database with knockdown/knockout of transcription factors. Nucleic Acids Res. 2020 Jan 8;48(D1):D93-D100. doi: 10.1093/nar/gkz881. PMID: 31598675; PMCID: PMC6943067.

END

撰文丨小斯
排版丨西西
值班 | 小太阳
主编丨司马牧野

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多