分享

用多组学揭开人类心肌梗死细胞“秘密”,中国科学家合作绘制一体化高分辨率图谱,为研究心肌梗死提供重要参...

 江海博览 2022-09-13 发布于浙江

“我准备 9 月底回国,然后会在 11 月份前往哈佛大学医学院加入卢卡·皮内洛(Luca Pinello)教授组做博士后。之后我打算回国、并在国内学校找一个科研职位。”德国亚琛工业大学医学院李志坚博士表示。

图片

图 | 李志坚(来源:李志坚

近日,他以共同作者身份在 Nature 发表了一篇论文,生成了迄今为止领域内最大、也是最全面的人类心肌梗死后心脏组织的空间多组学图谱。对于研究心肌梗死和开发新疗法,这些数据可以提供重要参考。

据悉,该工作主要关注人类心肌梗死,又称心梗、或心脏病发作。它是指由于供应心脏的血管堵塞,所导致的心肌细胞缺氧性坏死,其死亡率超过 30%,是威胁人类健康的“头号杀手”。

据 21 年20数据统计显示,仅在中国每年发生心肌梗死的患者约有 100 万人,并且发病年龄正呈现越来越年轻化的趋势。

在这项工作中,李志坚和所在团队利用最新的单细胞测序技术,来研究心肌梗死后人类心脏组织的重塑过程。

为此,他们从 23 个病人中,采集 31 个处于不同时间点和生理结构区域的人类心脏样本,其中包括 4 个健康人类心脏的样本作为对照组。

图片

(来源:Nature

通过对每一个样本使用单细胞转录组测序(scRNA-seq,small conditional RNA sequencing )、单细胞染色质开放性测序(scATAC-seq, Single-cell sequencing assay for transposase-accessible chromatin)、以及空间转录组测序(Spatial Transcriptomics)技术,最终生成了上述空间多组学图谱。

具体来说,借助使用最新的计算分析方法,该团队研究了单个细胞如何被它临近的细胞所影响,以及这种影响如何改变了细胞的基因转录和调控状态。

图片

(来源:Nature

基于单细胞多组学数据,课题组鉴定出心肌细胞、内皮细胞 、骨髓细胞和成纤维细胞中与疾病相关的子细胞类型。

此外,该团队还开发出一个新的计算方法来推断基因调控网络,这让他们得以更好地理解病变时,驱动基因变化的调控过程。

最后,其通过公共交互式平台 Cellxgene,其公开了本次空间多组学数据,以让科研人员自由使用这一数据集。

近日,相关论文以《人类心肌梗死空间多组学图谱》(Spatial multi-omic map of human myocardial infarction)为题发表在 Nature 上。

图片

图 | 相关论文(来源:Nature

李志坚担任共同第一作者,德国海德堡大学医院胡里奥·赛斯-罗德里格斯(Julio Saez-Rodriguez)教授、亚琛工业大学医学院拉斐尔·克拉曼(Rafael Kramann)教授担任共同通讯作者。

图片

(来源:Nature

图片从 250 份提案中脱颖而出

据悉,该研究始于美国测序公司 10x Genomics 于 2019 年举办的一项挑战赛。当时,该公司刚刚发布了空间基因表达解决方案。

这一技术允许用户在测量所有基因表达量的同时,保留基因表达发生的位置,进而获得不同细胞种群的空间位置。

为了推广该技术,10x Genomics 公司邀请全世界的研究人员提交一份关于如何使用空间转录组学进行研究的、最长 300 字的提案。最终的获胜者,将可以免费使用该技术。

幸运的是经过两个月的评选,在 250 多份提案中,李志坚所在团队提交的“使用空间多组学技术研究人类心肌梗死后心脏组织重塑过程”的方案拔得头筹。

图片

(来源:Nature

这让他和所在课题组得以在新技术诞生伊始,就将其应用到科研中。之后,来自德国埃里希和汉娜·克莱斯曼研究所的合作者,提供了 8 个来自不同时间点和生理结构区域的心肌梗死后人类心脏样本。

对于这 8 个样本,李志坚和所在团队分别进行了单细胞转录组测序、单细胞染色质开放性测序和空间转录组测序。最终在 年2020初,所有测试实验走到尾声。

接下来,他们开始分析数据。一开始,由于样本数量不是很大,其使用的策略是逐一分析单个样本转录组、表观组和空间转录组。

即对每一个样本,该团队先是使用 scRNA-seq 数据和聚类分析方法来定义细胞类型,接着再用迁移学习的方式来注释 scATAC-seq 数据。

最后,他们根据从 scRNA-seq 和 scATAC-seq 数据中鉴定到细胞类型标记基因,来注释空间转录组数据。

图片

(来源:Nature

年2020 12 月,课题组完成了全部数据分析工作,并向 Nature 提交初稿。总的来说,四位审稿人都觉得该研究很有趣。然而,其中三位审稿都提到一个重要问题:这一发现到底在多大程度上是可重复的?

在不同实验条件下,课题组都只有一个样本,这的确大大减低了研究结果的可信任度。此外,他们是对样本进行逐个分析,并没有系统性地比较人类心脏组织在心肌梗死发生后不同时间点差别。

“我们当时也意识到,这是一个无法回避的的问题。讨论过后,大家决定增加样本数量。”李志坚表示。

为了收集更多健康和病变的人类心脏样本,该团队的合作者——亚琛工业大学肾脏病学院的克里斯托弗·库佩(Christoph Kuppe),几个月里基本跑遍了德国和荷兰的所有医院。

终于在他的努力下,课题组又成功收集到了 23 个样本。加上之前的 8 个,样本数量达到 31 个。这样一来对于每个实验条件来说,他们都拥有至少三个重复样本,研究结果也将更具统计学意义。

图片

(来源:Nature

紧接着,对于每一个新的样本,该团队又重复了之前的实验,即分别进行 scRNA-seq、scATAC-seq 和空间转录组测序。21 年20 8 月,新样本的测序工作告一段落。

接下来,便是数据分析阶段。样本数量的增多,也让课题组意识到之前逐一分析的策略完全行不通。

因此,他们使用了全新的计算分析方法,即先是分别整合所有的 scRNA-seq 和 scATAC-seq 数据。在此基础上,单独对每个数据集进行聚类分析,进而注释所得到的细胞类型。

然后,对于每一个细胞类型,研究人员都会在不同时间和空间上,比较其基因转录和调控方面的变化。这让他们得以在分子层面上,系统性地研究人类心脏组织在发生心肌梗死后的修复与重塑过程。

最终,经过 7个多月的数据分析,该团队在 2022 年 3 月向 Nature 提交修改稿,并于 5 个月后正式发表。

图片

(来源:Nature

图片

“不完美巧合”:论文在博士答辩后一小时上线

同时,鉴于研究涉及到大量数据,所以该团队分出两个课题组专门做数据分析。李志坚主要负责预处理所有的测序数据、以及 scATAC-seq 和 scRNA-seq 的数据整合与分析。

来自德国海德堡大学的合作者、即论文的两位共同一作,则主要分析空间转录组和 scRNA-seq 数据。

李志坚表示:“我们两个组的工作内容相差较远,对于具体名词的理解不太相同。有时会为了在论文中,到底该使用哪个词讨论一个多小时。其中一个例子是,在论文的最后,我们对成纤维细胞进行了轨迹推断(Trajectory inference),以鉴定出基因调控因子。而我们的合作者认为,使用 trajectory 这个词不太准确,不过最终经过差不多两个小时的讨论,我还是说服了他们。”

图片

(来源:Nature

另一个比较有趣的是,论文上线时间为 8 月 10 日,正是李志坚博士答辩的那天。不过,论文最终上线时间,还是比他的答辩晚了一小时。

“我导师跟我开玩笑说,如果 Nature 早一个小时上线这篇论文,我就可以在我的 presentation 里面正式展示这项工作了。”李志坚说道。

据介绍,李志坚来自河南安阳。其本科毕业于吉林大学计算机科学与技术学院,硕士毕业于华中师范大学计算机学院。读研期间,他的研究方向是智能优化算法、及其在动态优化问题中的应用。

之后,其获得德国亚琛工业大学医学院的资助,出国攻读计算生物学方面的博士,目前主攻单细胞数据的分析。

除了此次工作,他还以一作身份在 Genome Biology 和 Nature Communications上发表了两篇关于 ATAC-seq 计算方法的论文。

由于疫情影响,他刚在上个月拿到博士学位,并获得德国博士最高荣誉 summa cum laude。目前,不久后,即将到美国开始下一站博后。

scMEGA——是他手头的另一个工作。scMEGA 是一个基于单细胞多组学增强子的基因调控网络推断的框架。相关论文也正在审稿中,第一次审稿后有位审稿人要求他针对单个细胞类型的基因调控网络,做以深度分析。

一开始,他和同事试着使用已有方法比如 Pando 来分析,但是发现此路不通。所以,计算机专业出身的李志坚,尝试通过写代码解决该问题。

而在此次 Nature 论文发布之后,其导师觉得 scMEGA 方法具有一定的应用价值。后来,李志坚把代码整理了一下,开发出一个 R 包,并将其命名为 scMEGA,目前代码已发布在开源代码托管网站 GitHub 上[2]。

李志坚所在课题组的下一步计划,则要进一步研究心脏在发生心肌梗死后的重塑过程,最终希望确定新的治疗靶点,并通过开发药物去减少、或修复组织损伤。

比如,在此次 Nature 论文中,该团队预测了调控人类心肌梗死中、肌成纤维细胞激活的基因调控网络。

因此,他们计划选择一些重要的调控因子进行实验,来测试是否能减缓心脏组织的纤维化。

图片

参考资料:

1.Kuppe, C., Ramirez Flores, R.O., Li, Z. et al. Spatial multi-omic map of human myocardial infarction. Nature 608, 766–777 (2022).

2.https://github.com/CostaLab/scMEGA

图片


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多