分享

科研 | Scientific Data:人肾脏单细胞RNA测序(国人作品)

 转录组 2021-04-20


编译:贤,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读
肾脏是具有许多不同功能且高度复杂的器官,肾小球和肾小管是肾单位的重要组成部分;这些结构的功能复杂性可能与其不同的细胞类型有关。目前已有研究人员对肾脏不同组成部分进行了大规模RNA测序,但是批量RNA测序不能反映单细胞水平的转录组,而只能反映总体平均RNA表达。本研究对人肾脏的单细胞悬液,以高通量液滴介导的scRNA-seq平台进行单细胞转录组测序。

论文ID

原名:Single-cell RNA sequencing of human kidney

译名:人肾脏单细胞RNA测序

期刊:Scientific Data

IF:5.929

发表时间:2020.1

通讯作者:程继文、莫曾南

通讯作者单位:广西医科大学

DOI号:10.1038/s41597-019-0351-8

实验设计

从医院获取三份样品(肾脏123)后放入含汉克平衡盐溶液中冰浴,切开0.5-1.0 g全层肾炎组织,将其放置在不锈钢细胞过滤器上,用注射器的柱塞将组织压碎。杜尔贝科磷酸盐缓冲盐溶液清洗两遍,收集,弃去上清液,用TrypLE Express酶消化,然后使用杜尔贝科改良的Eagle培养基终止消化。离心,弃去上清液,加入5毫升DPBS复溶并过滤。滤液使用红细胞裂解缓冲液提取红细胞5分钟,离心,弃去上清液,再加入5毫升DPBS复溶并过滤。然后,稀释每个样本的适当体积,回收10000个肾细胞。随后,将单细胞悬液、凝胶珠和油添加到10x基因组学的单细胞A芯片中。液滴生成后,将样品进行逆转录获取cDNA cDNA扩增10个周期后,开始测序(1a

1 scRNA-seq揭示了人类肾脏的细胞群

a)人肾脏组织样品的scRNA-seq过程

bUMAPtSNE图显示了肾细胞的无偏分类。

c)每种肾细胞类型的比例饼图。

d)显示每个簇的标记基因热图。

结果

1. 测序结果质量控制

细胞的筛选标准研究使用MergeSeurat函数来合并三个肾脏数据集,根据肾脏样本中基因的中位数和线粒体基因的百分数(2a),筛选了具有小于200和大于2500个基因的细胞和过滤掉含30%以上线粒体基因的细胞。由于这些数据来自三个不同的样本,为了避免批次效应影响下游分析,采用了一种缓解批次效应的策略(Harmony)。为了确保分析的可靠性,还采用了另一种近邻算法(MNN),发现这两种消除批次效应的方法产生了相似的结果(2c)。因此,使用Harmony来消除批量影响并继续进行下游PCA分析,并基于jackStraw函数识别出显著主成分(PCs)

2 人肾单细胞数据的质量控制

a)三个肾脏样本中每个细胞中的基因数量散点图。

b)线粒体基因的百分比与mRNA读数之间的关系。

c)三个不同肾脏样品之间的批次效应。

d)每个细胞的细胞周期状态UMAP图。

e)来自GSE107585的先前肾脏单细胞数据中的基因数量小提琴图

2. 聚类分析

经质量控制后,共获得23366个高质量的肾细胞,这些细胞可以分为10个细胞簇,每个簇由79-11539个细胞的细胞组成(1c),并使用两种不同的方法(UMAPtSNE)可视化了细胞聚类,两者得到结果相同(1b)。这10类细胞簇分别对应于近曲小管细胞,近端小管细胞,近端直小管细胞,NK-T细胞,单核细胞,肾小球壁上皮细胞,远端小管细胞,集合管主细胞,B细胞和集合管插层细胞(1d)。结果显示,PT(近端小管)细胞非常丰富,高达20308个,根据标记,PT细胞可分为三个不同的部分,包括近曲小管、近直小管和未准确分类的PT细胞(1b3a)

3. 差异基因分析

共检测了三个不同肾脏样本之间的批次效应(2c),当分辨率为0.25时,由FindClusters函数进行聚类,得到10种不同的类型,然后利用findallmarker函数寻找不同类型细胞间的差异表达基因。采用Seurat方法选择了三种类型的PT细胞,包括20308PT细胞在内的数据被导入Monocle2。使用的基因至少在10个细胞和大于5%的细胞中表达。随后,使用细胞局部密度(rho)和最近距离(delta)的阈值来确定集群的数量。然后,在所有的细胞群中进行了差异基因表达分析。使用前1000个差异表达最显著的基因(PCs)作为有序基因集,并进行降维和轨迹分析。

分析后提出了一种细胞亚群的详细分类方法。首先选择20PCs0.25分辨率的参数来识别10种细胞类型(1b)时,cluster 4NK细胞和T细胞的高表达标记基因,被指定为NK-T细胞(1d)。而cluster 4可以进一步分为两个子类(4b)。当将参数修改为20PCs,分辨率为0.8时,就可以准确地分辨NKT细胞(CD3D+CD3E+GNLY+NKG7+)T细胞(CD3D+CD3E+IL7R+)(4c-g),可用于下游分析的方法。

4 通过scRNA-seq对集合管主细胞和NK-T细胞详细分类图

a)集合管主细胞标记AQP2和集合管插层细胞标记ATP6V1B1ATP6V0D2ATP6V1G3的表达小提琴图。簇810分别是收集导管主细胞和收集导管插入的细胞。

bUMAP图显示降维后NKT细胞和T细胞的空间位置。红点代表NKT细胞,绿点代表T细胞。

c–gNK细胞标记GNLYNKG7的表达小提琴图。

4. 比较分析

将之前GSE107585的肾脏单细胞数据与每个细胞检测到的基因数量进行比较(2e)后,发现每个细胞的中位基因数是941个,这与个本文研究的scRNA-seq结果比较接近。

集合管最初被认为只在水的再吸收中起作用,而近年来对集合管功能的认识有了很大的提高,为肾小管远端如何进行盐和水的再吸收、钾的稳态和酸碱状态提供了新的模型,同时,也为集合管细胞提供了转录组信息(1bcluster 8, 10)。根据标记表达,可将集合管细胞分为主细胞(cluster 8)和插层细胞(cluster 10)(4a)。考虑到这三个健康的肾脏样本是来自于肾癌患者,必须确认它们的普遍代表性,通过许多以往对人肾scRNA-seq在近端、远端和集合管细胞的标记基因的研究,发现几乎所有的PT细胞基因都在本研究的PT细胞中高度表达。这些用于集合远端小管细胞的基因大部分在本文数据中表达。因此,这些结果是可靠的。

5. 细胞周期分析

使用Seurat程序对之前定义的43G1/S54G2/M细胞周期基因核心集进行细胞周期分析。以两组基因的最大平均表达量对细胞进行分类。当G1/SG2/M的循环积分均小于2时,认为这些细胞是非循环的。否则,认为细胞是增殖的。细胞周期分析后,未见细胞周期基因引起的偏倚(2d)

6. PT细胞分化轨迹分析

使用差分Gene Test函数查找具有随伪时间(pseudo-time)变化的基因,并建立PT细胞分化轨迹。通过应用Monocle2来执行所有PT细胞的伪时间轨迹来显示它们之间的命运决定(3b-e),发现了影响命运决定的前六个基因(3f)。并展示了影响命运决定的前50个基因(3g)

3 PT细胞亚群及PT细胞的发育轨迹

a)标记基因在PT细胞中表达的小提琴图。聚类123分别指近曲小管,近端小管和近直小管。

bMonocle2生成的三种PT细胞类型的伪时间轨迹(n = 20,308)。

c)伪时间的颜色从深到浅蓝色渐变。

d)伪时间轨迹被Monocle2分为三个不同的状态。

e)三个样本中细胞分布的轨迹。

f)影响命运决定的前六个基因。

g)影响细胞命运决定的前50个基因进行聚类的热图。这50个基因被分为三个簇(簇1,簇2和簇3),分别显示了发育轨迹的开始阶段,过渡阶段和结束阶段的基因。

评论


本研究获得了23,366个高质量人肾细胞的单细胞转录组数据,提供了人类肾脏细胞的转录组图谱为肾小管细胞的准确分类以及研究肾小管细胞与疾病之间的关系提供了重要的参考,此外还将有助于研究肾脏细胞生物学以及细胞类型与疾病之间的关系。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多