分享

单细胞测序技术简介(二)

 生物_医药_科研 2019-08-08


全心全意就为医生服务,一心一意只为造福医生

01
细胞悬液寄送

对于细胞系及血细胞,我们接受寄送来的细胞样本,并会在公司进行细胞数量、细胞活性的质控。10X平台对细胞活性的要求较高,建议活细胞数量在90%或以上。

对于培养的细胞系,我们公司建议1x106/ml细胞量。

对于血细胞,我们公司建议1x107/ml细胞量。

(1)细胞系样本常温寄送参考方法

1)将待测细胞接种于细胞培养瓶中

2)待细胞生长到培养瓶面积的50%,加入37℃培养液灌满整个培养瓶

3)扭紧瓶盖,封口膜封好

4)在培养瓶外侧包裹保温棉

5)常温运输

(2)细胞系样本冻存寄送参考方法

1)细胞系生长密度达到70%或以上

2)将细胞用冻存液重悬混匀,分装至冻存管中,每管1 ml,每个样本建议送3管(冻存液配制:90%FBS+10%DMSO,可根据细胞系特性调整冻存液体系) 。

3)冻存方法:室温准备梯度降温盒,内置新鲜异丙醇约250 ml(异丙醇可重复使用3-5次),将装有细胞悬液的冻存管放入梯度降温盒,置于-80°C冰箱过夜

4)干冰运输

(3)冻存血液样本寄送参考方法

1)抽取5 ml人外周血加入到EDTA抗凝管中。将血液和淋巴细胞分离液置于20°C水浴箱中20 min,并保证所有操作在无菌条件下进行

2)加入等量HBSS稀释全血

3)吸取2 ml淋巴细胞分离液,加入15 ml的离心管,将离心管倾斜45°,用枪吸取4 ml稀释后的全血,在离分层液面上1 cm处,沿离心管壁缓慢加入,使稀释血液量叠于分层液上,保持两者界面清晰(血样与分层液体积比例约为2:1)

4)20°C,500×g水平离心20 min(务必将离心机降速设置成no break),离心后管中内容物分为三层,上层为血浆(内含细胞碎片),中间层为分层液,底层为红细胞,在上、中层液体界面处可见到乳白色混浊的单个核细胞层(白膜层,薄),单个核细胞包括淋巴细胞和单核细胞

5)弃去最上层,小心将200 μl移液枪插入白膜层,沿离心管壁周缘吸取界面层单个核细胞,移入另一离心管中

6)加入5 ml HBSS洗涤,300xg离心10 min,弃去上清

7)加入1 ml HBSS重悬细胞,于显微镜下计数,以备按照每管1×107/ml细胞浓度进行冻存

8)活细胞精确记数;之后4°C,300xg离心5 min

9)加入4°C预冷重悬培养基(含40%FBS)重悬细胞至浓度为20x106 cells/ml,冰上操作

10)缓慢加入等体积2X冷冻培养基(含30%DMSO)至细胞浓度为10x10cells/ml,并轻柔混匀细胞

11)冰上将1ml细胞悬液加入冻存管,遂将冻存管放到4°C预冷CoolCell® FTS30中,-80°C放置4 h以上,确保顶部基底部通风口不被堵塞保证足够的空气流通

12)液氮冻存,干冰运输

02
细胞复苏及活性检测

根据客户送样方式选择不同的细胞复苏方法,之后用细胞计数器进行活细胞计数,若活细胞比例能达到80%,则可继续进行后续实验。如上门操作,则会在客户制备完细胞悬液之后立即进行活性检测。

技术原理图

技术原理:利用8通道的微流体“双十字”交叉系统,将含barcode的凝胶珠(Gel Beads)、细胞和酶的混合物、油三者混合,形成GEMs。

GEMs形成后,细胞裂解,凝胶珠自动溶解释放大量barcode序列,随后mRNA逆转录产生带有Barcode和UMI信息的cDNA,再构建标准测序文库。

03
反转录+建库

将检测合格的细胞经洗涤、重悬制备成合适浓度,根据想获取目的细胞的数目上样。上样完成后,观察油包水液珠是否正常形成。液珠质控合格后,将其吸出转移到PCR管中进行反转录及文库构建。库检合格后,进行上机测序。

建库流程图

04
上机测序

一般情况下,我们推荐每个细胞测50,000-100,000条reads,应用Illumina Hiseq PE150的测序策略,即得每个细胞测15-30M数据量。测序存在一定饱和性,适当加大测序数据量可提高基因的检出率,下图为10X对于测序饱和度情况所做的测试分析。

05
数据分析

数据分析流程图

单细胞转录组分析
1
质控分析

1.1 原始测序数据过滤

10X Genomics文库采用Illumina HiSeq PE150进行测序,read1前26bp为细胞barcode和UMI信息。为了保证后续分析的结果准确可靠,需要对原始的测序数据进行预处理,获取用于后续分析的有效数据(Clean Data)。具体处理步骤如下:

1) 去除低质量reads;

2) 去除 N 碱基达到一定比例的 reads(默认设为10bp);

3) 去除与 Adapter 之间 overlap 超过一定阈值(默认设为 15bp)的 reads;

经过如上的数据过滤过程,得到clean data。

1.2 Raw Data数据质量评估

采用FastQC对下机后的数据(raw reads)质量进行基本的统计,每个样本中包含6个子图。

1.3 Clean Data数据质量评估

我们还会对对质控后的数据(clean reads)采用FastQC进行基本的质量统计,每个样本中同样包括6个子图。

2
Cell Ranger流程简介

使用Cell Ranger流程对10X单细胞测序数据进行后续分析:reads比对,细胞基因表达统计,聚类和差异分析。

2.1 比对

Cell Ranger流程使用的STAR比对软件将reads比对到参考基因组上,然后根据比对结果和参考基因组GTF注释信息,统计外显子区、内含子区、基因间区分别的reads数量,同时将外显子区的reads比对到转录本上,仅使用比对到一个基因上且与转录本方向一致的reads进行UMI统计。

2.2 细胞和基因表达统计

Cell Ranger利用barcode和UMI 统计每个样品中的细胞数量、以及细胞的reads数和检测到的基因数。当样品含有RNA含量极其不同的细胞群体混合物时,会倾向于忽略细胞。当条形码排列图(或密度图)和细胞中的分数读数低于60%时、或在barcode分布中出现二次分布的是可以观察到的。

Cell Ranger具备 multigenome analysis以区分多物种混合建库的样品;细胞barcode被分成H和M两类,以UMI的数量来区分的。但当出现UMI数量超过H和M的1%时,称为多细胞。因为Cell Ranger仅能检测到H、M两类的多细胞,所以多细胞比例是根据多重细胞簇数量来估计的。

2.3 聚类

(1)降维

为了将基因的表达矩阵降低到最重要的特征,Cell Ranger使用PCA将数据集的维度从cells*gene改成cell*M,M是用户可选择的compons事数量,该分析方法采用了IRLBA算法,并进行了一定的修改,目的在于减少内存的消耗。

(2)聚类

Cell Ranger使用两种不同的方法用于对表达相似的细胞聚类:Graph-based基于图的聚类算法,是通过构建稀疏邻近的图,然后再图中寻找高度连接的Louvain算法。k值是细胞数量值取对数得到;在聚类的过程中,若cluster中没有差异基因,则会进行进一步的层次聚类,直到没有可以合并的cluster。

K-Means的算法是将数据构建k个子集,然后计算每个类的中心点,向中心点聚集,直到聚类结果不在变化时停止。

2.4 差异表达分析

每cluster相对于其他所有cluster的差异基因,Cell Ranger使用简单快速的sSeq方法(基于负二项检验)。当counts数量逐渐增大的时候,Cell Ranger将会自动使用edgeR中的beta检验。差异表达分析是通过对一个cluster中所有细胞特定基因表达量均值相对于所有其他细胞特定基因表达量均值进行分析得到结果。

3
数据统计

采用10x提供的分析流程cell ranger进行数据分析,主要结果如下所示:reads数量,测序质量评估,参考基因组比对率,估算样本中细胞数量、每个细胞中reads数均值和基因数中值。

4
数据分析

4.1 t-SNE Projection of Cells Colored by UMI Counts

每个细胞barcode进行总UMI计数,UMI数量多的细胞可能较UMI数量少的细胞RNA含量更高,通过t-SNE算法得到的二维图。在这个二维空间中,彼此接近的细胞对具有更相似的基因表达谱。显示限于10000个细胞的随机子集。

4.2 t-SNE projection of Cells Colored by Automated Clustering

通过聚类的算法,将每个细胞进行聚类分析。聚类的结果是将具有相似表达谱的细胞组合在一起,由t-SNE算法得到的二维结构,聚在一起的细胞具有更相似的基因表达,显示限于10000个细胞的随机子集,K-means最大为10。

4.3 Top Genes By Cluster

展示每个cluster显著差异的基因,这是每个cluster中所有细胞特定基因表达量均值相对于其他所有cluster中所有细胞特定基因表达量均值进行分析得到结果,log2 fold-change (log2FC)为均值比的对数值,p值基于负二项检验且经过多次Benjamini-Hochberg校正,表示差异显著性。

4.4 Sequencing Saturation

显示测序深度(细胞平均reads数)的增加对测序饱和度影响的变化曲线, 端点附近曲线斜率为0,表示从该点测序数据近似于饱和,继续增加测序深度无意义

4.5 Median Genes per Cell

显示测序深度(细胞平均reads数)的增加对每个细胞检测得到的基因数中值影响的变化曲线,斜率表示在该点增加单位测序量带来的边际效益。

5
富集分析

通过对不同聚类方式每个cluster差异高表达基因进行富集分析,可以找到每个cluster差异高表达基因与哪些生物学功能或通路显著性相关。采用clusterProfiler软件对每个cluster差异高表达基因集进行GO功能富集分析,KEGG通路富集分析。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多