scATAC-seq测序实验通常效率很低,应执行方案优化步骤,以最大限度地提高细胞质量和文库复杂性,并最大限度地减少环境染色质污染和PCR重复。虽然s3-ATAC和HyDrop的测序效率均明显低于商业检测,但这种灵敏度降低是由不同的机制引起的;s3-ATAC样品包含许多峰区域之外的片段,而HyDrop片段高度重复。
在灵敏度方面,10x v2表现最佳,平均每个细胞峰中回收10,021个独特片段,显著高于 Bio-Rad ddSEQ (4,228)、HyDrop (1,180) 和s3-ATAC (1,203) 。TSS富集在不同方法中也存在显著分层,10x v1.1、mtscATAC 和s3-ATAC得分≤ 21.7,10x v1、v2、multiome和HyDrop样本得分在25.2至27.6 之间,Bio-Rad ddSEQ得分平均为32.6。HyDrop (38.5%)、mtscATAC-seq (37.3%) 和s3-ATAC (18.9%) 中的FRIP显著低于Bio-Rad ddSEQ 和其他10x方法(57.3–62.7%)。
随着测序深度的增加,独特片段的数量有所增加,但在各种技术的不同水平上都达到饱和。例如,在较低的测序深度下,ddSEQ样本的表现优于10x v1、v1.1和multiome,但在较高的测序深度下效果却相反。TSS富集也取决于测序深度,但很快饱和。由于duplicate reads的增加,测序效率随着测序深度的增加而降低。
研究团队使用Scrublet和Freemuxlet的模拟数据或基因型信息识别了双胞。Scrublet的双峰分数随着峰中独特片段的中位数线性下降,而Freemuxlet的置信度随着这些指标的增加而增加,这表明片段的数量是双峰检测背后的关键因素。
与Scrublet和Freemuxlet类似,Seurat的置信度强烈依赖于测序深度和每个细胞的独特片段数量。10x和Bio-Rad ddSEQ方法都获得了较高的中位标签转移分数,而HyDrop和 s3-ATAC 的分数明显较低。
在本研究的细胞计数平衡分析中,10x方法在所有细胞类型中比ddSEQ和HyDrop回收了更多的DAR。s3-ATAC也回收了大量DAR,但与其他技术相比,强度大大降低。就DAR强度而言,10x v1和v2表现最好,ddSEQ的表现与其余10x方法相当。
此外,研究团队在上述细胞类型平衡子集的合并数据集上计算了细胞类型特异性DAR。对最强DAR处的scATAC-seq信号或每种细胞类型前2,000个最强DAR的比较显示10x方法和Bio-Rad ddSEQ之间的信号总体一致。s3-ATAC和HyDrop在DAR周围都显示出较弱的信号。
在所有细胞类型中,来自10x方法的DAR在转录因子基序的归一化富集分数中得分最高。ddSEQ、s3-ATAC和HyDrop得分明显较低。
为了比较每种方法检测样本之间差异的能力,研究团队重点关注男性和女性样本之间观察到的差异。与细胞类型特异性DAR获得的结果类似,ddSEQ捕获的DAR比10x方法更少且更弱,但差异不太明显。s3-ATAC和 HyDrop都恢复了更少、更弱或没有性别特异性DAR。
除了使用PBMC进行系统基准测试之外,研究团队还使用了公开的成年小鼠皮层scATAC-seq数据。在所有指标中,10x和ddSEQ的表现明显优于HyDrop和s3-ATAC。