做生物信息学分析,免不了要跟DNA,RNA,蛋白序列打交道。前面给大家介绍过几种获取DNA反向互补序列的方法。 最近小编又get了一个新的R包Biostrings,能轻松的实现序列反转,互补,反向互补配对等操作,今天就迫不及待的来跟大家分享一下。 #我们的DNA序列 DNA_seq="AGCTTATCGATCGATCGTAGCTACGTAGCTACGTAC"
#首先需要安装Biostrings这个包 BiocManager::install("Biostrings")
#加载Biostrings这个包 library(Biostrings) #构建DNAstring对象 DNA.str <- DNAString(DNA_seq) DNA.str 接下来我们来看看这个包都能做什么事情 #查看序列长度 length(DNA.str) #获取反向序列 rev_seq=reverse(DNA.str) #转换成字符串 toString(rev_seq) #获取互补序列 complement(DNA.str) #获取反向互补序列,一个函数就搞定了 reverseComplement(DNA.str) #转换成RNA序列 RNAString(DNA.str) #翻译成氨基酸序列 translate(DNA.str) #统计每个碱基出现的次数 letterFrequency(DNA.str, DNA_BASES) #统计每个碱基出现的频率 letterFrequency(DNA.str, DNA_BASES, as.prob = TRUE) #统计序列的GC含量 letterFrequency(DNA.str, "GC", as.prob = TRUE) 为了方便大家交流学习,共同进步,我特地创建了微信交流群 |
|