小结:
1)短读长组装工具生成的contig连续性和#NC最低。
2)在高深度测序数据集(>100X)上,MEGAHIT优于IDBA-UD和metaSPAdes;在低复杂度数据集(深度<100X)上metaSPAdes的结果优于MEGAHIT和IDBA-UD。
3)linked-read组装工具的contig N50显著高于短读长组装工具。
4)Athena在来自人类肠道微生物组的数据集中表现出比cloudSPAdes更高的contig N50,并且在所有组装器中生成了最高的#NC。
5)长读长组装工具表现出较高的contig N50,但生成的#MQ和#HQ较短读长和linked-read组装工具要小。
6)MetaFlye、Canu和Lathe比其他长读长组装工具表现更好。MetaFlye在ONT和PacBio CLR数据集上生成了最高的GFs和ALs。Lathe在ONT数据集上比metaFlye和Canu生成了更高的#NC。
7)混合组装比短读长和长读长组装具有更高(或至少相似)的GFs和ALs,并且生成的#HQ和#NC比长读长组装工具更高。
8)Unicycler和MaSuRCA生成的GF和AL较其他混合组装器较低,但实现了最高的contig连续性。Unicycler或OPERA-MS在Illumina和PacBio CLR测序的真实数据集上生成了最高的#NC。MaSuRCA在Illumina和ONT测序的真实数据集上获得了比其他混合组装工具更多的#NC。