大家好,今天和大家分享的题为Droplet barco ding for single-cell transc ripto mics applied to embr yonic stem cells(应用于胚胎干细胞的单细胞转录组学液滴条形码)该方案在2013年被Nature评为年度技术,但其测试通量较低,因此2015年两篇基于液滴的单细胞测序技术Drop-Seq发布在Cell上,其大大提高了单细胞测序的通量,并成为了最成功的商业化单细胞测序公司10Xgenomics的技术基础。 01 研究背景 绘制基因图谱一直是生物学家的梦想单细胞水平的表达。有了这样的数据可以追踪异质细胞亚群,并推断基因和路径。最近,RNA测序已经实现单细胞分辨率。限制是有效的常规隔离和处理大量数据的方法用于定量深入测序的单个细胞。我们开发了一种高通量用于条形码的液滴微流体方法来自数千个单个细胞的RNA,用于下一代测序的后续分析。 这个该方法显示出令人惊讶的低噪声轮廓,并且很容易适应其他基于测序的方法。我们分析了小鼠胚胎干细胞,详细揭示人口结构和白血病后分化的异质性发作抑制因子(LIF)戒断。再现性允许的这些高通量单小区数据我们解构细胞群并推断基因表达关系。 见图一 数千个细胞的DNA条形码平台。 图一 用裂解缓冲液、逆转录混合物和携带条形码引物的水凝胶微球将细胞封装在液滴中。封装后引物被释放。在逆转录过程中,用条形码标记每个液滴中的cDNA。然后液滴破碎,所有细胞中的物质呈线性测序前扩增。UMI=唯一分子标识符。 见图二 条形码水凝胶微球合成。 图二 (A) 含有常见DNA的水凝胶微球的微流体制备。比例尺100 mm。 (B) 常见的DNA引物:丙烯酸磷酸酰胺部分(蓝色)、可光裂解间隔区(绿色)、T7 RNA聚合酶启动子序列(红色)和测序引物(蓝色) (C和D)微球的组合条形码的方法。*=反向补码序列。 (E) 完整组装的引物:T7启动子(红色)、测序引物(蓝色)、条形码(绿色)、合成接头(深棕色)、UMI(黄色)和poly-T引物(紫色)。 见图三 Droplet条形码设备。 图三 (A) 微流体装置设计,另见图S2。 (B和C)封装模块(左)和采集模块(右)的快照,另请参阅影片S1和S2。箭头表示细胞(红色)、水凝胶(蓝色)和流动方向(黑色)。比例尺100 mm。 (D) 随时间变化的水滴占用率。 (E) 细胞和水凝胶共包封统计数据显示高1:1的细胞:水凝胶对应关系。 (F) BioAnalyzer追踪显示文库丰度对引物光释放的依赖性。 (G) 单元格/控件的数量作为采集量的函数。 见图四 Droplet条形码中的技术噪声。 图四 (A) 液滴完整性控制:小鼠和人类细胞被共同封装,以明确识别多个细胞共享的条形码;4%条形码共享鼠标/人的混合读取。 (B) inDrops技术控制示意图和每个液滴的UMI滤波映射(UMIFM)读数的直方图。 (C) 作为每液滴UMIFM读数的函数检测到的独特基因符号。 (D) 刺突分子的平均UMIFM读数与其输入浓度线性相关,捕获效率b=7.1%。 (E) 方法灵敏度S作为输入RNA丰度的函数;红色曲线是二项抽样的灵敏度极限(S=1 e bx)。 (F) 标准化后纯RNA的CV平均图。数据点对应于单个基因符号;实线是二项式采样噪声极限。对于丰富的转录物,方法效率b中的液滴到液滴的可变性设置了基线CV(虚线曲线:CVb=5%),另见图S3。 (G) 基因CV的观察值和生物学值之间的关系,Fano因子和相关性,显示低效如何抑制Fano因子(方程2),并削弱相关性(方程3)。 见图五 inDrop测序揭示ES细胞群体结构。 图五 (A) ES细胞转录组的CV平均图。纯RNA对照(蓝色);基因的变异性明显高于对照组(黑色)。实线和虚线曲线如下如图4F所示(细胞大小的可变性=20%,参见补充信息中的理论方程S4)。插图:两个技术复制细胞群体的基因CV(总计n=5956个细胞),另见图S4。 (B) 显示低(Ttn)、中等(Trim28、Ly6a、Dppa5a)和高(Sparc、S100a6)表达变异性的说明性转录物计数;曲线拟合为泊松(红色)和负二项式(蓝色)分布。 (C) 高于泊松(a.p.)噪声,(CV2-1/平均值)。误差条=SEM。 (D) 共表达图概括了已知和新的基因表达关系(见正文)。 见图六 基因相关性中保留的调控信息。 图六 (A) 一种从弱和/或高度相关的基因相关性的细胞间变异推断稳健基因关联的策略,另见图S6。 (B–D)Nanog、Sox2和细胞周期蛋白B的基因邻域。灰色方框标记经验证的多能性因子;蓝色方框标记以前与多能状态。 (E和F)体细胞系(K562)和小鼠ES细胞中44个细胞周期调节转录物的相关性显示细胞周期依赖性转录的缺失在ES细胞中(基因名称见图S6)。基因是按层次聚类排列的。色标适用于(E和F)。 见图七 ES细胞分化的异质性。 图七 (A) 通过对高度可变基因的细胞-细胞相关性进行分层聚类,观察LIF退出后全球群体结构的变化。 (B和C)LIF退出后基因表达的平均值(B)和分布(C);(C)中的小提琴图表示表达给定数量 计数;点显示前5%的单元格。误差条=SEM。 (D和E)3034个细胞的前两个PC显示分化不同步。 (F) 作为时间函数的表观细胞和PrEn细胞部分。误差条=SEM。 (G) 分化ES细胞和基因的tSNE图谱(右)揭示了推定的群体标记(另见图S7和表S4)。 (H) ES细胞和LIF退出后基因表达变异的内在维度,在分化过程中显示出较小的波动子空间。纯RNA对照缺乏相关性,并显示出最大的波动子空间。 02 研究结论 我们在这里报道了一个单细胞捕获、条形码和转录组分析,对可处理的细胞数量没有物理限制。该方法可捕获样本中的大部分细胞,采集时间快,且成本低技术噪音。 这种方法适用于小型临床样本,包括肿瘤和组织微生物组,并打开增加了常规鉴定细胞类型(即使是罕见的)的可能性,基于基因表达。 这种类型的数据也很有价值通过在单个细胞之间进行自然变异来鉴定基因之间假定的调节联系。我们举了几个这样推断的例子,但这类数据本身就很有用到更正式的逆向工程。 好了,今天的文献解读就到这儿来,我们下期再见!如果你正在开展临床研究.需要方案设计.数据管理. 数据分析等支持.也随时可以联系我们。 |
|