分享

【R语言】Biostrings序列处理函数

 生信交流平台 2021-12-29

    做生物信息学分析,免不了要跟DNA,RNA,蛋白序列打交道。前面给大家介绍过几种获取DNA反向互补序列的方法。

☞使用R获取DNA的反向互补序列

R如何reservse一个字符串

最近小编又get了一个新的R包Biostrings,能轻松的实现序列反转,互补,反向互补配对等操作,今天就迫不及待的来跟大家分享一下。

#我们的DNA序列DNA_seq="AGCTTATCGATCGATCGTAGCTACGTAGCTACGTAC"
#首先需要安装Biostrings这个包BiocManager::install("Biostrings")
#加载Biostrings这个包library(Biostrings)#构建DNAstring对象DNA.str <- DNAString(DNA_seq)DNA.str

接下来我们来看看这个包都能做什么事情

#查看序列长度length(DNA.str)

#获取反向序列rev_seq=reverse(DNA.str)#转换成字符串toString(rev_seq)

#获取互补序列complement(DNA.str)

#获取反向互补序列,一个函数就搞定了reverseComplement(DNA.str)

#转换成RNA序列RNAString(DNA.str)

#翻译成氨基酸序列translate(DNA.str)

#统计每个碱基出现的次数letterFrequency(DNA.str, DNA_BASES)

#统计每个碱基出现的频率letterFrequency(DNA.str, DNA_BASES, as.prob = TRUE)

#统计序列的GC含量letterFrequency(DNA.str, "GC", as.prob = TRUE)


果然还是要站在前人的肩膀上,才能看的更远。

为了方便大家交流学习,共同进步,我特地创建了微信交流群

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多