分享

核酸序列数据库有哪些?常用核酸序列数据库盘点!

 ChrisChris 2023-07-19 发布于四川

核酸序列数据库在生物科学和生物信息学领域中扮演着重要的角色。无论是基因组注释、生物多样性研究、功能预测和基因表达分析还是药物研发和疾病研究,核酸序列数据库为生物科学和生物信息学研究提供了宝贵的资源,帮助研究人员理解生物的遗传信息、功能和进化关系,推动生物医学研究和药物研发的进展。

但需要注意的是,核酸数据库有很多种类,除了常用的BioXFinder、GenBank、EMBL(European Molecular Biology Laboratory)DDBJ(DNA Data Bank of Japan)等核酸数据库,研究人员通常会使用多个数据库来获取更全面和准确的数据。此外,还有其他一些重要的核酸序列数据库,如RefSeq、UniProt等,它们在特定领域或特定类型的序列数据上具有特殊的优势。

为此笔者通过网站数据调研,找出了核酸数据库应用最为广泛的TOP60数据库,并对前面几个应用做了深层次优缺点对比,供大家作为选用依据(不分排名先后)。

1. BioXFinder

BioXFinder是国内第一个也是目前唯一国内中英双版的生物数据库,是款针对生物科研工作者的综合性生物数据检索及分析平台,汇集了核酸、蛋白、蛋白结构、代谢通路和信号通路信息,同时集成了BLAST生存分析、基因ID转换等生信分析工具。用户可高效的搜寻到自己想要的信息,并且在无代码的情况下完成生信分析。

2. GenBank

GenBank是最早建立的核酸序列数据库之一,拥有丰富的序列数据资源,涵盖了广泛的物种和基因组。提供了详细的注释信息,包括基因的位置、结构、功能以及相关的文献引用。

支持多种查询和下载方式,方便用户获取所需的数据。

缺点是由于数据量庞大,有时查询和下载速度可能较慢。注释信息的质量和一致性可能存在一定的变化,因为数据的提交来自不同的实验室和研究机构。

3. EMBL

EMBL是一个国际性的核酸序列数据库,与GenBankDDBJ合作共享数据。它拥有全球范围内的序列数据资源。提供了丰富的注释信息,包括基因的功能、结构、表达模式等。

数据库的维护和更新工作得到了专业的团队支持,注释信息的质量较高。

缺点是数据库的查询和下载界面相对较复杂,对于新手用户可能需要一定的学习和适应时间。有时数据的更新可能相对较慢,尤其是来自较新的研究领域或物种

4. DDBJ

DDBJ是日本的核酸序列数据库,与GenBankEMBL合作共享数据。它包含了来自亚洲地区的丰富序列数据资源。数据库的维护和更新工作得到了专业的团队支持,注释信息的质量较高。提供了多种查询和下载方式,方便用户获取所需的数据。

缺点是数据库的数据量相对较小,特别是与GenBank相比,涵盖的物种和基因组范围较窄。注释信息的语言主要是日语,对于非日语用户可能需要一定的翻译工作。

5. RefSeq

6. UniProt

7. NCBI Trace Archive

8. PDB (Protein Data Bank)

9. SILVA (Small Subunit rRNA Database)

10. RDP (Ribosomal Database Project)

11. miRBase (microRNA Database)

12. FlyBase (Drosophila Database)

13. WormBase (Caenorhabditis elegans Database)

14. TAIR (The Arabidopsis Information Resource)

15. Ensembl

16. SGD (Saccharomyces Genome Database)

17. Rfam (RNA families database)

18. Pfam (Protein families database)

19. KEGG (Kyoto Encyclopedia of Genes and Genomes)

20. dbSNP (Single Nucleotide Polymorphism Database)

21. HGNC (HUGO Gene Nomenclature Committee)

22. TIGR (The Institute for Genomic Research)

23. STRING (Protein-Protein Interaction Database)

24. GEO (Gene Expression Omnibus)

25. ArrayExpress

26. CCDS (Consensus CDS Database)

27. PharmGKB (Pharmacogenomics Knowledge Base)

28. COSMIC (Catalogue of Somatic Mutations in Cancer)

29. ClinVar (Clinical Variation Database)

30. dbGaP (Database of Genotypes and Phenotypes)

31. HapMap (The International HapMap Project)

32. ExPASy (Expert Protein Analysis System)

33. Swiss-Prot

34. TrEMBL

35. FlyBase (Drosophila Database)

36. WormBase (Caenorhabditis elegans Database)

37. ZFIN (Zebrafish Information Network)

38. MGI (Mouse Genome Informatics)

39. RGD (Rat Genome Database)

40. PomBase (Schizosaccharomyces pombe Database)

41. TAIR (The Arabidopsis Information Resource)

42. Gramene (Plant Comparative Genomics Database)

43. VectorBase (Vector-Borne Pathogen Database)

44. dbCAN (Carbohydrate-Active enZYmes Database)

45. DrugBank

46. PubChem

47. CATH (Protein Structure Classification Database)

48. MEROPS (Peptidase Database)

49. CRISPRdb (CRISPR-Cas systems database)

50. HGMD (Human Gene Mutation Database)

51. IEDB (Immune Epitope Database)

52. TCDB (Transporter Classification Database)

53. PANTHER (Protein ANalysis THrough Evolutionary Relationships)

54. H-InvDB (Human Transcriptome Database)

55. COG (Clusters of Orthologous Groups)

56. InterPro

57. LNCipedia (Long Non-Coding RNA Database)

58. lncRNAdb (Long Non-Coding RNA Database)

59. circBase (Circular RNA Database)

60. lncRNADisease (Database for Long Non-Coding RNA-Associated Diseases)

61. CRISPRCasdb (CRISPR-Cas Subtype Database)

这些数据库涵盖了更多的物种、功能和领域,包括基因组学、蛋白质学、代谢组学、疾病相关数据等。它们在不同的研究领域和应用中发挥着重要的作用,为科学家和研究人员提供了丰富的数据资源和工具。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多