分享

【生信】GEO数据挖掘视频课学习笔记# #{序列数据库}

 CharlesNice 2020-10-19

GenBank简介

  • 美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核算序列

  • 由NIH下属的国立生物技术信息中心NBIC建立,与日本DNA数据库(DDBJ)以及欧洲分子生物学实验室核酸数据库(EMBL)一起,构成国际核酸序列数据库合作,每天交换数据。


    GenBank进入方法

    NBIC网址:https://www.ncbi.nlm./    [search]


    GenBank基本检索功能

  • 限定词检索

  • 特殊标识符检索(ACCESSION,GI)

  • 范围检索

  • 高级检索


    限定词检索


       限定词检索

  • 基因名称的检索限定词:[GENE] or[GENENAME]

  • 生物体名称的检索限定词:[ORGN]or[ORGANISM]

  • 作者姓名的检索限定词:[AUTH] or[AUTHOR]


    标识符检索

  • 基因信息号(GI)

    • 为一串数字,如6995995

  • GenBank/EMBL/DDBJ序列接收号

    • 1个字母+5个数字如U12345

    • 2个字母+6个数字如AY12345

  • PDB序列接受号

    • 1个数字+3个字母如1TUP

  • RefSeq序列号

    • mRNA记录(NM_*)

    • 基因组DNA重叠群(NT_*)

    • 完整基因组或染色体(NC_*)

    • 基因组局部区域(NG_*)

    • 人类基因组序列注释加工得到的序列模型(XM,XP,XR_*)


    范围检索

  • 序列接受号范围检索

    • AF114696:AF114714[ACCN]

      序列接受号的检索限定词为[ACCN]或者[ACCESSION]

  • 序列长度范围检索

    • 3000:400O[SLEN]

  •  日期范围检索

    • 2012/O1:2015/12/31[MDAT]or[PDAT]


    高级检索


    检索结果页面Format功能

    一般是summary的形式

  • GenBank

  • Accession List

  • FASTA

  • GI List


BLAST简介

Basic Local Alignment Search Tool

局部相似性基本查询工具--程序包(包含多个独立程序)

基于序列相似性的数据库搜索程序


1.NCBI主站点:

    http://www.ncbNolm./BLAST/(网络版)

    ftp://ftp.ncbi.nlm.nM.gov/blast/(单机版)

2.其他站点:

    http://life./blast/

    http://nema.cap./ncbi_blast.html

https://blast.ncbi.nlm./Blast.cgi

或NCBI的【Resource】


BLAST的主页有下列功能

nucleotide blast


BLAT

The BLAST-Like Alignment Tool

当时随着人类基因组计划的进展,把大量的基因和ESTs快速定位到

较大的基因组上称为一种迫切需要。blast相对于这种比对有几个缺陷:速度偏慢、结果难于处理、无法表示包含intron的基因定位

对于比较小的序列对大基因组的比对,blat是首选。

速度快,共线性输出结果简单易读。无需访问硬盘硬盘,占用的系统资源很少

数据库索引一次性读入内存,可以反复地高速调用,

网址:http://genome./cgi-bin/hgBlat

UCSC主页上有BLAT的网页版入口

    UCSC网址:http://genome./

输出结果:

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多