搜索

分享

QQ空间 QQ好友新浪微博微信

【原】【R语言】Biostrings序列处理函数

生信交流平台 2021-12-29

展开全文

做生物信息学分析，免不了要跟DNA，RNA，蛋白序列打交道。前面给大家介绍过几种获取DNA反向互补序列的方法。

☞使用R获取DNA的反向互补序列

☞R如何reservse一个字符串

最近小编又get了一个新的R包Biostrings，能轻松的实现序列反转，互补，反向互补配对等操作，今天就迫不及待的来跟大家分享一下。

#我们的DNA序列DNA_seq="AGCTTATCGATCGATCGTAGCTACGTAGCTACGTAC"

#首先需要安装Biostrings这个包BiocManager::install("Biostrings")

#加载Biostrings这个包library(Biostrings)#构建DNAstring对象DNA.str <- DNAString(DNA_seq)DNA.str

接下来我们来看看这个包都能做什么事情

#查看序列长度length(DNA.str)

#获取反向序列rev_seq=reverse(DNA.str)#转换成字符串toString(rev_seq)

#获取互补序列complement(DNA.str)

#获取反向互补序列，一个函数就搞定了reverseComplement(DNA.str)

#转换成RNA序列RNAString(DNA.str)

#翻译成氨基酸序列translate(DNA.str)

#统计每个碱基出现的次数letterFrequency(DNA.str, DNA_BASES)

#统计每个碱基出现的频率letterFrequency(DNA.str, DNA_BASES, as.prob = TRUE)

#统计序列的GC含量letterFrequency(DNA.str, "GC", as.prob = TRUE)

果然还是要站在前人的肩膀上，才能看的更远。

为了方便大家交流学习，共同进步，我特地创建了微信交流群

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：生信交流平台 > 《待分类》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

生信交流平台

关注对话

TA的最新馆藏

【科研热点】坏死性凋亡相关基因
TCGA数据差异表达分析
Seurat绘图报错-Error in Ops.data.frame(guide_loc, panel_loc)
推荐几个不错的RNA剪接位点预测网站
【R语言】找不到对象%AND%
【科研热点】血管拟态化基因

喜欢该文的人也喜欢更多

热门阅读换一换