配色: 字号:
Single-cell RNA sequencing for the study of development, physiology and disease
2021-01-26 | 阅:  转:  |  分享 
  
单细胞RNA测序用于发育、生理和疾病的研究Single-cellRNAsequencingforthestudyofdevel
opment,physiologyanddisease摘要:当下的技术可以确定单个细胞的全部基因表达谱,有利于隐匿在细胞群中
的异质性细胞的分离。单细胞RNA测序研究的目的:(1)区分细胞群中各类细胞的分子类型,Eg受体、TF、GF、转运体等(2)有助于
理解组织学上相似,相邻细胞是如何分化的(3)有利于更多的了解先前的已知的细胞特征,并鉴定出新的细胞类型(4)提高我们对常态和病态生
理过程的认知,开发出新的治疗方法(5)提供人体所有类型细胞的基因表达模式的细节图谱引言:单细胞研究技术发展的原因:(1)细胞基因表
达模式决定了蛋白组成,展示细胞细致的表型特征,这些都是分子发生功能的基础。(2)传统的基因表达研究是对大量的细胞池进行分析,这样虽
然能够获得大量的RNA,但是在分析精度上是存在缺陷的,它得到只是一个细胞群的平均表达谱,不能确定特定的某个细胞类型的基因表达情况。
Eg癌症和疾病(3)在器官发育上也存在细胞的异质性,对祖细胞群的基因表达分析,不能确定促使祖细胞向下游分化的信号途径。(4)相比
于累加分析,单细胞测序也能加深对细胞行为的理解。单细胞RNA测序的目标:HumanCellAtlasProjects(人类细
胞图谱计划),HumanBioMolecularAtlasProgram(人类生物分子图谱工程),ChanZuckerbe
rgInitiativeAtlasProject等均致力于确定每种细胞类型的差异表达基因的集合。本文结构:从单细胞RNA测序
分析的基本概念和该技术在发育、癌症、常态和病态肾脏研究中的应用两方面进行阐述。其中单细胞RNA测序分析的基本概念中将会着重讨论目前
的实验策略和不同技术的优劣。正文:1.方法概述:a.RNA测序原理因为高表达的基因会产生更多的RNA,RNA测序过程中,逆转录后产
生更多的cDNA,在高通量测序会读取到更多的该基因序列,DNA序列读取的次数进而可以和基因表达程度相匹配,所以RNA测序是一项研究
基因表达模式的有力工具。传统的RNA测序流程是:样品中RNA的提取→逆转录成cDNA→高通量测序→依据读取结果判段基因表达情况。除
去上述流程,单细胞RNA测序还有两个特别的步骤,即单细胞的分离和RNA的扩增。单细胞的测序流程:组织分离→单细胞获取→细胞裂解→逆
转录→扩增→文库制备→测序→分析b.高通量的单细胞测序因为单细胞RNA测序需要分析大量的细胞和RNA,所以高通量测序方法的引
入,极大的推动了单细胞测序的发展。如:流体C1微流控系统:1天的时间内,进行1次循环读取96个细胞;高通量液体IFC芯片一次可测定
800个细胞;细胞特异条形码的cDNA文库的建立,虽然提高了基因表达读取的质量,但成本非常昂贵。(1)微滴法(代替了微室法)使
用微流技术就可以产生微滴,成本比液态的分析低,对RNA测序或DNA测序基本上都是一个细胞1美元。这些微滴由油包裹,有两微升的体积,
其内部含有一个单细胞和一个含有一组特异条码寡核苷酸的珠子,细胞裂解之后,条码寡核苷酸和释放的mRNA杂交。对于Drop-seq技术
,珠子、附着的寡核苷酸和退火的mRNAs都从微滴中释放出来,并结合到一个单管中,然后进行反转录。而铬微滴法和InDrop技术,水凝
胶珠溶解在微滴中,释放寡核苷酸与mRNAs杂交,并且在微滴中进行逆转录反应。在任何一种情况下,珠特异性条形码被带到转录出来的cDN
A中,从而使之后DNA序列读取与特定细胞对齐。铬微滴法较Drop-seq方法的优势:①相比于Drop-seq技术,铬微滴法可检测单
个细胞中更多的基因,获取的数据质量较高。因为它较好的敏感性,也减少了测量过程中因技术带来的噪音,有助于读取细胞表达模式上的微小差异
。②因为铬微滴可以尽可能将更多的单细胞包裹到含有珠子的微滴中,所以它能提供待分析细胞群中更多细胞的基因表达谱。Drop-seq中珠
子和单个细胞是随机装配到一个微滴中,如果一个微滴中有两个单细胞和一个珠子,则这两个细胞会被标记为一类;如果一个微滴中有一个细胞和两
个珠子时,这个细胞则被分为两类,为避免不是一一对应的情况发生,所以要将细胞和珠子进行充分稀释,以保证20液滴中有1个单细胞,10个
液滴中有1个珠子,因为该系统符合双泊松分布,所以最终的结果只能得到5%的待测细胞的RNA序列数据;相反,铬微滴中的水凝珠是由高浓度
背靠背的方式装载的,在控制珠子注入速度的情况下,可以保证每个微滴中有一个珠子,又因为两个细胞在一个珠子中是单泊松分布事件,所以更多
可能是一个微滴中一个细胞,最终能得到50%的待测细胞的RNA序列数据,比Drop-seq高了十倍。③便于启动和操作铬微滴法较Dro
p-seq技术的劣势:所用试剂成本高。(2)非微流体法除去上述方法,也可以通过简单分拣或流式荧光细胞分选技术,把任意大小的单细
胞放置在微孔板上进行单细胞的RNA测序分析。各种扩增方法可以和微孔板法联合使用,比如:SMARTseq2chemistry,
Cel-seq,MARS-seqandSTRT-seq。SMARTseq2和STRT-seq通过PCR的方式扩增cDNA,
Cel-seq和MARS-seq是将一个细菌病毒的启动子整合到cDNA中,在体外转录扩增。微孔板法的优点:①对细胞的大小不敏
感。对细胞敏感程度由大到小的技术排序:流体系统>微滴法>微孔板法②需要的设备简单,启动成本低。③cDNA序列的全覆盖。SMAR
T-seq2可以进行可变剪切模式分析,鉴定潜在的具有不同功能的转录本,而Drop-seq,InDrop,Chromium和8
00cellIFCFluidigm只能提供cDNA3’或5’端的序列信息,而不是整个转录本的信息,所以它们不能进行可变剪切
模式的分析。CytoSeq技术:通过引力将单个细胞沉降在微孔中,将饱和浓度的珠子悬浮液放在微孔上,多余的珠子会被去除,以保证每个
孔中,只有一个珠子,这些珠子和上述提及相同,之后裂解细胞,将mRNA释放出来与珠子上的寡核苷酸进行杂交等等。优点是不需要复杂的微流
控系统,可以待分析细胞的数量自由调控微孔的数量。SPLiT-seq技术:这个过程中,细胞本身经过温和的固定和渗透后,就成了微滴。
将单个细胞随机分成96孔板的孔,用特异性良好的引物在细胞内进行逆转录反应。条形码以顺序和组合的方式连接到cDNA上。96孔微滴定板
的单个孔中的所有细胞都有一个短的特异性寡核苷酸序列连接到它们的所有cDNA上。然后将整个微滴定板的细胞汇集到一根试管中,充分混合并
随机分配到另一个96孔板的孔中。又一次,短而特异的寡核苷酸被连接到cDNA上,以进一步形成条形码。经过三轮合并和拆分过程,然后是第
四轮,共有24个独立的PCR,总共提供了21233664(96^324=21233664)个可能的条形码组合。该技术的优点是减少
设备需求的数量,并降低文库构建时的成本。c.试验设计考虑细胞数量、每个细胞的读取和生物复制。虽然每一项的数量越多越好,但成本
也会增高。不同技术对单个细胞序列读取数量的多少是不一样的,应依据细胞之间的相似度进行选择2.单细胞研究的挑战a.有限的实验材料
每个细胞中含有总RNA量为10皮克,mRNA量为0.1皮克,因此需要通过扩增来获得足量的cDNA,但不幸的是cDNA在扩增过程中是
非线性的,使得序列的读取数量不能真实的反应细胞内的基因表达情况。为了解决这一问题,在初始逆转录的寡核苷酸引物中加入8碱基的特异分子
标识符(UMI),扩增结束后,含有相同UMI标记的所有cDNA被压缩成一次mRNA和寡核苷酸的杂交,最终读取的是首次逆转录产生的c
DNA量,而避免了扩增对细胞基因表达比例的影响。数据反卷积过程中的这一压缩步骤可以消除大多数基于扩增的基因表达数据失真。b.单细
胞的捕获获取单细胞的方法:微操作:可以保证分理出的是单细胞,但劳动量大不能达到高通量的要求。激光捕获显微解剖(LCM):可
获得一些空间上的信息,但依旧是低通量。使用LCM干净的捕获到一个细胞的内容物,而不损伤RNA,依旧具有挑战性。FACS(流式荧光
细胞分选仪):高通量,可用于少量样本的富集。scRNA-seq技术优点:高通量,可同时检测大量细胞,在初始组织中的每一种细胞都可
以被检测到,且不需要细胞特异性的标签。缺点:①在分离细胞中,会使空间信息丢失,不能重构单细胞分辨率的三维基因表达图谱。解决方法:借
助生物信息学的手段,根据已知特定位置的基因表达特征来确定空间位置。新类型细胞空间位置的确定还需要依靠原位杂交和免疫荧光技术。②
酶解组织获取单细胞的过程中,为响应新的,且酶解温度是37℃的环境,细胞会改变表达模式(egFOS和JUN家族的基因会表达上调)。
这种基因表达的人工产物会污染单细胞RNA测序的数据。解决方法:①在机械均化制成的细胞核中进行RNA-seq。①由于只有少部分的胞
质RNA在细胞核中,因此技术产生的噪音也会增加,人们也怀疑核中的RNA比重是否能够真实的反应胞质RNA。②核中的RNA大部分是未成
熟的,还含有内含子,使数据分析也变十分复杂。②在细胞裂解过程中,使用转录抑制剂。但转录抑制剂不易被吸收,且该方法只抑制了RNA的合
成并未考虑RNA的分解带来的影响。③使用冷适应的蛋白质酶分离单细胞,可以很好的抑制基因表达模式因处理方式的改变。③组织中各类细
胞的形态,状态或对分离环境的敏感程度不同,所以单细胞悬浮液中细胞类型的比例还不能很好地反应初始组织的情况。c.噪音①生物噪音(
20%)。基因并不是以一个稳态的方式进行表达的,它具有搏动性和爆炸的特点,即在一个短时间内进行活跃转录,这意味着一个特定的细胞基因
表达是处于动态过程。②转录水平的测定方法。(80%)scRNA-seq对于低水平表达的基因,是很难检测到的。逆转录和扩增的无效性
也增加了技术噪音。解决办法:无监督聚类。通过聚类和结合,将信息进行互补,就可以得到稳定的基因表达谱。增加每个集群中的细胞数量提高
了这种互补方法的有效性和分析的准确性。一旦单个细胞被划分为簇,每个组的数据就会被汇集起来,以更敏感和完整地表示该细胞类型的基因表达
模式,反之,则得到的是各类型细胞的平均效应。3数据分析a.表达基因的鉴定将scRNA-seq数据去卷积,根据条形码的特异性匹配细胞
,确定扩增过程中,cDNA的比例不变,最终基因表达读取的数字就代表了基因表达的模式。b.质控为确保用于scRNA-seq分析的细胞
正常,应进行指控,移除异常细胞可以是数据结果更加合理。①被认为应当表达的基因表达数量少的细胞,会弱化数据集②有高比例的线粒体DNA
被读取的细胞,可能死掉了,胞膜通透性增加,是胞质RNA泄露。③因为红细胞中有大量血红蛋白的表达,也应当被移除。c.分析策略降
维:通过各种预测模型算法使高维数据变为低维数据重复聚类:优点:①可以基于复杂的基因表达特征分类,不局限于细胞特异性的标记基因;②
可以克服关键基因遗漏带来的问题。重复聚类分析将细胞类型逐渐细化,但需要注意不能基于噪音聚类,为评判分类的合理性和需要参照基因表达的
热图,细胞亚型间基因表达模式的差别还需要正交实验进一步验证(eg免疫荧光、FISH(原位荧光杂交)等)。d.数据分析软件Seur
at,Sincera,AltAnalyze,Monocle,Backspin,Pagoda,scLVM,NMF,S
CDE,RaceID,HiLoadG-HC,RC,SCellWishbone,Wanderlust,DPT,p-C
reodeandothers。4.应用a.发育(1)多谱系启动胰腺:在发育过程中,有些单细胞表达多种未来可能分化的细胞类
型的基因。如:单个祖细胞表达外泌体和内分泌谱系相关的基因,而单细胞表达多种内分泌激素相关的基因。这种多系启动,即祖细胞共同表达多个
不同谱系的基因,也在造血系统中被看到,当时被描述为基因表达混乱。肾囊泡的scRNA-seq分析表明,细胞会处于谱系决策的中间阶段
。例如,肾小泡上靠近收集管的远端区域,几乎没有足细胞相关的基因的表达,说明它们不会向足细胞方向分化。但在肾泡的近端,许多细胞随
机且稳定的表达足细胞相关基因,表明这些细胞又向该方向分化的可能。许多相同的细胞也表达与其他谱系相关的多个基因。(2)器官发育图
谱单细胞转录谱可用于创建器官发育的高分辨率基因表达图谱。这种图谱将定义不同发育阶段每个细胞类型表达的所有转录因子、生长因子和受体
,可以全面表征转录过渡状态。策略:分离发育器官的细胞→进行高通量的scRNA-seq分析→无监督聚类→空间重建早期肾脏发育:scR
NA-seq分析表明,基质细胞是胶质细胞源性神经生长因子(GDNF)的重要来源细胞,冲击了以前认为帽间充质肾祖细胞是GDNF主要来
源的认知。肺发育:scRNA-seq数据分析也表征了双潜能细胞,鉴定出新的细胞类型标记,发现了发育多阶段中的多种细胞类型的转录调控
子,并定义了这些细胞的全基因表达模式。(3)器官和类器官发育的意义对心脏的单细胞研究定义了心内膜、成纤维细胞和心肌细胞谱系在发育
过程中的基因表达模式的变化,对Nkx2.5杂合缺失的小鼠心脏分析,表明心肌细胞的串扰是心内膜细胞成熟所必需的。scRNA-seq研
究了iPSCs在形成肝芽时基因表达谱的变化,定义了iPSCs向肝细胞分化过程中所需基因的表达模式序列,多能基因的逐渐下调和控制内胚
层形成的基因的上调。对移植的肝脏器官进行scRNA-seq分析表明,肝脏血管生成的过程中缺氧、炎症和基质重塑的基因发挥了作用。此外
,对肝脏器官中所有细胞类型的互补受体和配体表达分析,确定了发育中的内皮细胞、间充质细胞和肝细胞细胞之间的潜在串扰。在这方面的深入理
解,有助于生长因子混合剂的制备,促进改良的肝器官的产生。b.癌症对肿瘤微环境中基质细胞基因表达模式的研究可以提供有别于固有癌细胞基
因表达研究提供的预后价值。显然,scRNA-seq技术是解剖肿瘤内和周围多种细胞类型的特性的非常有用的工具。对人的结直肠癌和正常
黏膜的scRNA-seq研究,TGFB1是癌症相关成纤维细胞(CAFs)中表达最上调的差异表达调控基因。通过对基因表达模式的分析,
研究人员可以将成纤维细胞分为三种亚型:正常亚型、表达肌纤维细胞标记基因的亚型和表达一组不同基因特征的亚型。scRNA-seq结果也
可用于重新分析以前的大量RNA-seq数据集,从而将肿瘤分为三个不同的组。用scRNA-seq方法鉴定了一种新类型的胶质瘤特异性小
胶质细胞,它们表达促炎细胞因子(IL1A、IL1B、IL8和TNF)、细胞因子(CCL3、CCL4)和早期反应基因,这些特征可以将
其与典型的M1和M2小胶质细胞区分开来。人类乳腺癌组织的scRNA-seq分析确定了与上皮向间充质转化、干细胞、血管生成、增殖和肿
瘤复发有关的基因的可变表达。scRNA-seq也被用来定义乳腺肿瘤中由细胞亚型差异表达的基因,研究表明,这些肿瘤中的大多数非癌细胞
是免疫细胞,包括衰竭或调节性T细胞这些具有免疫抑制特性的细胞。衰竭的T细胞表型,表明T细胞功能的丧失。晚期疾病患者显示T细胞的
衰竭水平较高;scRNA-seq分析使这些T细胞的完整基因表达模式得以定义,并使新的衰竭标记基因得以描述。scRNA-seq也被用
来检测黑色素瘤的多细胞组成,揭示了多种细胞的表达特征。scRNA-seq定义了转移性透明细胞肾癌中的癌细胞异质性,确定有助于指导治
疗策略的活性信号通路,为患者提供个体化治疗。c.正常和疾病肾脏使用scRNA-seq方法研究收集管细胞中主细胞、A型插层细胞和B型
插层细胞间受体配体的基因表达,发现这三类细胞之间可能有相互影响,以确定收集导管细胞的特点,并进一步了解它们的生理调节。scRNA-
seq分析中使用铬微滴系统来检测57,979个细胞在成年小鼠肾脏上的基因表达模式。聚类分析将细胞分为16个簇,进一步的分析将其中
的3个簇分为总共8个子簇。基因表达分析鉴定了18种先前已知的细胞类型和3种新的细胞类型。其中一种新的细胞类型代表了收集管主细胞
和插层细胞之间的过渡状态。因此,这项工作提供了正常成体小鼠肾脏中各类细胞的详尽基因表达图谱,将疾病相关基因和特异的细胞类型联系起来
,并展现出成体肾脏中分化状态的灵活转变。研究检测了斑马鱼肾脏中单细胞基因的表达,基于微滴的InDrop系统来检测1699个非造血性
肾细胞的基因表达谱,对产生粘蛋白的细胞进行表征。利用scRNA-seq,研究人员也能够确定斑马鱼成年肾单位祖细胞的基因表达模式,结果表明其与哺乳动物胚胎帽间充质肾单位祖细胞的有显著相似性,均表达Six2、Eya2和Osr1基因。因此,这项研究定义了一个独特的常驻肾单位祖细胞群体存在于成年斑马鱼肾脏,这有助于解释其再生能力。scRNA-seq还被用于研究系统性红斑狼疮导致的肾脏疾病过程,确定了一个基因表达特征,即干扰素反应基因与疾病严重程度相关。有趣的是,来自狼疮性肾炎患者的皮肤样本与肾脏样本相似,也有干扰素反应基因的特征,说明这种易获得的组织为狼疮性肾炎患者提供了有用的疾病状态标志物。因此,scRNA-seq为正常肾脏生理提供重要的见解,定义了主细胞和插层收集导管细胞的完整受体表达谱,揭示了它们之间有细胞-细胞串扰,阐明了成年斑马鱼肾脏惊人再生能力的机制,还提供了对致病途径的见解,为病变肾脏确定了新的生物标志物和可能的治疗靶点。总结:scRNA-seq方法的限制因素:①因技术缺陷,在数据结果中存在噪音。②单细胞测序成本太贵。但是这项技术提高我们对发育、生理和疾病系统的认识,促进刻画基因表达图谱的发展,有助于个体化治疗的进步。
献花(0)
+1
(本文系生物聊吧原创)