转录因子(Transcription Factor,TF)一群能与基因5'端上游特定序列专一性结合的蛋白质分子。它们在基因表达调控中扮演着至关重要的角色,保证目的基因以特定强度在特定时间、空间表达,是理解包括发育和发病机理在内的生物过程分子调控机制的基础。主要功能:调节基因表达、参与胚胎发育过程、参与免疫反应。接下来开始正题,分享TF相关数据库: AnimalTFDB是一个综合性数据库,包括了183种动物基因组的全基因组范围内转录因子(TFs)和转录辅助因子分类和注释。在最新版本AnimalTFDB v4.0中,共有27万个TFs,根据DNA结合域被进一步分为73家族和六大类。同时,还有15万个转录辅助因子被分为82个家族和六大类。被认为是最全的TF数据库。https://guolab./AnimalTFDB4//#/
hTFtarget数据库从人类TFs(659个TFs的7,190个实验样本)在569种条件(399种细胞系类型,129类组织或细胞以及141种处理方式)下的大规模ChIP-Seq数据中精心整理出了全面的TF-target关系。可查询人类TFs靶基因,查询相应的ChIP-Seq样本信息,预测序列的转录因子结合位点等。https://guolab./hTFtarget/#!/ TRRUST数据库是一个基于文本挖掘和人工整理的人类和小鼠转录调控网络数据库。TRRUST v2版本包含了800个人类TFs和828个小鼠TFs的8,444个和6,552个TF-target调控关系,这些关系来源于11,237篇PubMed文章。数据库还提供了调控模式(激活或抑制)的信息。 PlantTFDB数据库,是一个专注于存储和管理与植物转录因子相关数据的资源平台。包含了从165个物种中预测的320,370个转录因子。对于TF都进行了全面的注释,包括功能域、三维结构、GO、PO、表达信息、特殊功能描述、结合motif序列、调控信息、相互作用、参考文献等。数据库还提供了与其他数据库的交叉链接,如UniProt、RefSeq、STRING、Entrez等http://planttfdb./index.php JASPAR数据库是一个专门用于收集、整理和分析转录因子结合位点motif信息的开放获取数据库。数据库共收集了脊椎动物、昆虫、线虫、真菌、植物和尾索动物六大类生物经过严格筛选和去重的相关数据。结合位点以位置频率矩阵(PFMs)的形式呈现。https://jaspar.genereg.net/ HOCOMOCO数据库是一个基于ChIP-Seq数据构建的人和小鼠转录因子结合位点(TFBS)的综合性数据库。数据库提供了基于实验数据构建,并经过严格筛选和验证的转录因子结合位点详细信息。并且提供了多种工具和功能,如MoLoTool可用于查找基因启动子区序列中结合的转录因子,MACRO-APE用于motif比较及相似motif检索等。
TransmiR数据库是一个专注于转录因子和miRNA之间调控关系的数据库。TransmiR v2.0包含了3,730个经过文献整理的TF-miRNA调控关系,这些关系覆盖了约623个TFs、约785个miRNAs、19个物种和1,349篇出版物。还提供了5个物种中基于ChIP-seq证据的1,785,998个TF-miRNA调控关系。还可基于人类TFs的结合 motif 矩阵来预测TF-miRNA的调控关系。 KnockTF2.0数据库是一个综合的人类和小鼠转录因子敲除(knockdown/knockout)基因表达谱数据库。存储了1468个手动整理的RNA-seq和芯片数据集,这些数据集与人类、小鼠、拟南芥和玉米中的612个TFs和172个转录辅助因子(TcoFs)相关。数据库还提供了TcoFs靶基因包括超级增强子、增强子、转录因子结合位点、各类SNPs、eQTL、甲基化位点、DNase I高敏感位点、染色质相互作用、染色质可接近区域、CRISPR/Cas9靶位点和拓扑关联域等遗传注释信息。https://bio./KnockTF/index.php 刘小乐团队开发Cistrome DB主要收录了来自人类和小鼠的ChIP-seq、ATAC-seq和DNase-seq数据,提供了大约45000个人类和44000个小鼠样本的转录因子、转录辅助因子、染色质重塑因子以及组蛋白修饰的全基因组位置信息。ToolKit分析工具可检索调控特定基因的TFs、结合在特定区域的TFs,以及查看哪些TFs的结果与输入peak结果有明显的重叠,用于转录因子的colocation分析。 ChIPBase v3.0是一个专注于注释和发现ChIP-Seq数据中miRNA和lncRNAs的TF结合途径以及其转录调控关系数据库。通过分析约55,000个ChIP-seq数据集,识别到了约171,600个基因与约3,000个调控因子之间的约151,187,000个调控关系。通过整合约65,000个正常样本和约15,000个肿瘤样本的表达谱,构建了调控因子与其靶基因之间的详尽共表达图谱。https:///chipbase3/index.php MotifMap是一个专注于分析和可视化转录因子结合位点(TFBSs)和motifs的数据库。该数据库整合了多种来源的ChIP-seq数据和高通量测序数据,旨在提供全面、准确的TF与DNA相互作用的信息:包括结合位点、结合强度等信息。
TRANSFAC数据库是一个关于真核生物转录调控的全面数据库。它整合了大量关于转录因子、TFs基因组上结合位点以及DNA结合profiles的信息。此外,还整合了TRANSCompel数据库(组成元件数据库)和TRANSpro数据库(全面收集人类和其他8个物种基因组启动子数据库)。 UniPROBE数据库存储了通过通用蛋白质结合微阵列(PBM)技术生成的体外蛋白质DNA结合特异性的数据。该数据库总共存储了来自原核生物哈维氏弧菌、真核生物疟原虫、寄生虫顶复门隐孢子虫、酵母酿酒酵母、秀丽隐杆线虫、小鼠和人类。的726种非冗余蛋白质和复合物的DNA结合数据。http://the_brain.bwh.harvard.edu/uniprobe/browse.php 今天分享的实用TF数据库就更新到这里了,有用记得收藏哦!课题设计、生信分析 扫码咨询 SCI科研热点、生信分析、好文分享关注
|