分享

使用biomaRt做hg19注释

 生物_医药_科研 2019-01-30
library(biomaRt)#需要注释的是hg19版本的21个乳腺癌相关基因,基因名称如下gene_list <->'CCNB1', 'MKI67', 'MYBL2', 'AURKA', 'BIRC5', 'CTSV', 'MMP11', 'ACTB', 'GAPDH', 'GUSB', 'RPLP0', 'TFRC', 'BCL2', 'SCUBE2', 'ESR1', 'PGR', 'GRB7', 'ERBB2', 'BAG1', 'CD68', 'GSTM1')length(gene_list)
#直接使用默认的数据库, 'www.ensembl.org'是默认链接mart <- usemart(biomart="">'ENSEMBL_MART_ENSEMBL', dataset = 'hsapiens_gene_ensembl')database <->1]=='hsapiens_gene_ensembl',] #可以看到使用的搜hg38的基因组gene_info <- getbm(attributes="">'ensembl_gene_id', 'external_gene_name', 'description'), filters = 'external_gene_name', values = gene_list, mart = mart)dim(gene_info)#由于基因组版本不匹配,多注释出一个基因#MMP11在hg38基因组上对应两个gene id

#链接改为'grch37.ensembl.org'mart <- usemart(host="">'grch37.ensembl.org', biomart = 'ENSEMBL_MART_ENSEMBL', dataset = 'hsapiens_gene_ensembl')database <->1]=='hsapiens_gene_ensembl',]#可以看到使用的搜hg38的基因组gene_info <- getbm(attributes="">'ensembl_gene_id', 'external_gene_name', 'description'), filters = 'external_gene_name', values = gene_list, mart = mart)dim(gene_info)
#重新注释结果正常



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多