搜索

分享

QQ空间 QQ好友新浪微博微信

如何用自己的双手，分析自己的数据？

ky之路 2020-11-29

展开全文

作者：小哈来源：嘉因

用BETA能get到哪些生物学特征？

预测转录因子的功能是激活还是抑制；
识别转录因子的靶基因；
鉴定转录因子motif及其collaborator。

输入文件长啥样？

BETA Basic和BETA plus需要2个输入文件。输入文件一，TF结合位点，即peak的位置；输入文件二，敲降或敲除或过表达或激活TF后所有基因的变化倍数和P值。

BETA Basic能预测转录因子的激活/抑制功能，并识别靶基因；

BETA plus除了Basic的两个功能外，还能鉴定转录因子motif及其collaborator。

如果只有ChIP数据，没有基因表达数据，还有BETA minus可以用，它能根据ChIP数据算出TF对靶基因的调控潜力。

BETA minus只需要1个输入文件，即输入文件一，peak所在的位置

输入文件一：

ChIP-seq的peak所在的染色体、start、end三列；

或MACS的输出文件*peak.bed

ChIP-chip的peak也可以作为输入文件一

输入文件二：

TF KD/KO/overexpressed/activeted样品与对照相比，基因表达差异分析结果：全基因组上的所有基因的ID、表达量变化倍数log值（上调为正值，下调为负值）、统计值（FDR或P值）三列；

或limma、cuffdiff的输出文件

注意，不能只给差异基因。

跟GSEA类似，BETA的算法需要全局所有基因。

除了RNA-seq、microarray以外，其他实验类型也可以作为输入，只要能按要求提供那三列信息就行。

参数设置：默认即可。

输出文件长啥样？

结果一：累积分布函数CDF曲线

BETA根据默认值或您提供的基因数量或P值，把基因分为上调UP、下调DOWN、不差异表达NON三组，然后计算UP/DOWN组跟NON的差异显著性。

图中黑色点线用NON组代表背景，红色为UP组，蓝色为DOWN组。

X轴：把基因按照regulatory potential score由大到小排序；

Y轴：基因累积比例。

例如下图a，X轴10000对应的蓝线Y轴为50%，红线Y轴为30%，黑色点线Y轴为30%。

也就是说：50%的下调基因都拥有较高的调控潜能（排在top10000），显著高于上调基因和背景。更多的peak倾向于富集在下调基因周围。

生物学意义：Tet1的功能是repressive，ESR1既有activiting又有repressive功能

有一篇帖子，从概念、实际意义到R语言实现，把CDF曲线讲的透透的：

http://blog./statistics-cdf/

点击左下角“阅读原文”，直达该帖。

结果二：靶基因

靶基因附近的peak

结果三：TF在DNA上结合的motif，包括上调靶基因区域的motif、下调靶基因的motif、上调特异的motif（跟下调的比、跟NON比）、下调特异的motif（跟上调的比、跟NON比）。

结果四：找到TF的collaborator

从结果三可以看出，找到的motif不只是目标TF的，还有其他TF的，排除相似motif以后，那些其他的TF就有可能是目标TF的collaborator。coIP搞起来！

怎么才能用上BETA呢？

有网页版吗？

有，Cistrome Analysis Pipeline提供丰富的表观遗传分析工具，可以在线分析，点点鼠标即可，不用敲代码。只是，由于不可描述的原因，小哈劝您还是用本地下载版本吧！

Windows系统能用吗？

理论上，应该可以吧！？

不懂生信，不装Linux，也能Run代码—Windows系统的Linux命令行工具Babun

如果不想装Linux，就买个苹果吧！

遇到问题可以问作者吗？

苏小妹一直活跃在BETA的google group上，有问题先去看看是不是已经有人问过了，解决了没？

在此感谢BETA作者苏小妹在本文撰写中提供的帮助！

如何打开google group？

看这里，生物人高效工作之——办公软件

转载本文请注明本文来自王程扬科学网博客。
链接地址：http://blog.sciencenet.cn/blog-3372875-1090325.html

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： ky之路 > 《待分类》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

ky之路

关注对话

TA的最新馆藏

[转] R语言中管道操作 %>%, %T>%, %$% 和 %<>%
一步搞定基因定点突变引物设计，3天拿到突变体——Quickchange
[转] GSEA分析结果详细解读
也谈谈机器学习中的Evaluation Metrics
QPCR结果你会分析么？本篇带你解锁这些内容，赶紧收藏起来吧
[转] 肿瘤体积倍增时间

喜欢该文的人也喜欢更多

热门阅读换一换