写在前面 做扩增子数据分析经常遇到一个问题?我们是否应该抽平数据呢?还是只需要做标准化就可以了?在微生信生物群中有许多人都问过这样的问题。这里我也将这个答案分享给大家。 抽平 实际上,抽平被许多数据分析工作者不愿意采用,相信大家都知道了,但是alpha多样性的分析在目前看来只能通过抽平进行后续的计算。所以如果要计算alpha多样性,就需要抽平。 满足下面两个条件要抽平 如果测序样本之间序列数差异在10倍以上,则需要对序列数高的样本进行抽平。 如果样本集中有部分样本序列数量少于10000条,也需要抽平。 抽平不可以做什么分析 基于抽平的序列可以做alpha多样性分析,也可以做beta排序和距离分析,但是如果要做差异检测,我们推荐不要使用抽平操作,推荐使用DESeq2和Edger包自带的数据标准化步骤。 最后,希望大家数据做的顺利,科研步步高。 |
|