分享

科研 | 剑桥:通过hyperLOPIT的弓形虫蛋白组综合亚细胞图谱为蛋白功能提供空间背景

 微科享 2021-04-19

编译:小友,编辑:Emma、江舜尧。

原创微文,欢迎转发转载。

导读

顶复门寄生虫对人体健康有严重的损害,这是因为它们体内的许多细胞隔间和复杂结构,促进了它们的生长、传播和对抗宿主的防御力。在本篇文章中,我们确定了全球流行的顶复门原虫——弓形虫内数千种蛋白的稳态亚细胞位置。这些数据揭示了蛋白表达及其发挥功能的位置、对宿主的适应性以及这些病原体的基本进化轨迹。


论文ID


原名:A Comprehensive Subcellular Atlas of the Toxoplasma Proteome via hyperLOPIT Provides Spatial Context for Protein Functions
译名:通过hyperLOPIT的弓形虫蛋白组综合亚细胞图谱为蛋白功能提供空间背景
期刊:Cell Host&Microbe
IF:15.923
发表时间:2020.10
通讯作者:Ross F.Waller
通讯作者单位:剑桥大学生物化学系

实验设计

实验结果

1. 弓形虫胞外速殖子的全细胞生化分离

为了确定是否可以同时捕获数千种蛋白的稳态亚细胞位置,我们将全细胞空间蛋白组学的hyperLOPIT方法应用于弓形虫胞外速生虫(寄生虫形式,是宿主细胞入侵的首要条件),hyperLOPIT方法利用细胞器和亚细胞结构在生化分馏(如密度梯度离心)后形成的独特丰度-分布图谱。蛋白通过这些馏分表现出相似的丰度分布曲线,被分配到不同的亚细胞结构中。

我们使用几种亚细胞标记蛋白对细胞匀浆进行蛋白印迹分析,确定了细胞破裂和密度梯度分布的最佳条件(图1B)。顶复门原虫的裂殖子,如弓形虫速殖子,具有坚固的细胞膜(图1A),可抵抗低渗裂解引起的细胞破坏。通过不连续匀浆密度离心,从可溶性胞质中富集的膜隔室和其他细胞颗粒,然后将该颗粒物在碘克沙醇的连续线性密度梯度上分级分离,从而得到适用于多种细胞器标记物的独特富集曲线(图1B)。通过在这些梯度中对九个馏分进行采样,再把其中一个作为细胞质材料,用独特的TMT10plex等压标记每个级分的肽,并通过质谱定量所有级分中的相对肽丰度,来测量所有可检测蛋白的丰度分布图(图1C和S1)。

我们进行了三个独立的hyperLOPIT实验,每一个细胞破裂,蛋白组分的制备和密度梯度上的分散有微小的变化,打算最大限度地捕获不同亚细胞蛋白生态位之间的可分辨差异(表S1)。在每个实验中,我们确定了超过4100个蛋白的定量信息跨越所有10个馏分( 图1D);3832个蛋白是共同的所有三个数据集提供完整的丰度-分布曲线信息跨越30个馏分( 图S1;表S2)。

图1 HyperLOPIT通过测量蛋白的分级分离曲线揭示细胞器蛋白集合

(A)弓形虫速殖子的示意图,显示了主要的亚细胞隔室和结构。(B)hyperLOPIT工作流程摘要。机械破碎细胞,匀浆分离(通过蛋白印迹条件优化,例如,杆状体(RON4),微线体(MIC2),线粒体(TOM40)和内膜复合体(GAP45)的标记),以及标有独特的10重串联质量标签的肽串联质谱(LC-SPS-MS3)进行相对肽定量分析。(C)在LOPIT2实验中测量的选择亚细胞标记蛋白的丰度-分布曲线。请注意与(B)中所示的WB结果的相似性。参见图S1的所有实验(30plex)的连贯的配置文件。(D)维恩图显示在三个hyperLOPIT实验的所有10个部分中鉴定和定量的独特和共享蛋白的数量。(E)三个hyperLOPIT数据集共享的3832个弓形虫蛋白的30个复合物定量蛋白组数据(即丰度分布图)的2D投影。每个数据点代表一个单独的蛋白,蛋白的聚类反映了其丰度分布曲线的相似性。(F)通过在t-SNE投影上叠加HDBSCAN对原始丰度分布图进行分析而发现的蛋白簇,不同的簇用颜色表示。(G)在弓形虫空间蛋白组数据的t-SNE投影上映射718个亚细胞标记蛋白。

2. 弓形虫胞外速殖子的全细胞生化分离

蛋白分馏数据被分析为共同的丰度-分布模式,作为亚细胞生态位内蛋白关联的证据。为了可视化30维数据,我们使用机器学习的维度降低方法t-分布随机邻域嵌入(t-SNE);t-SNE投影表示数据中存在复杂的结构,蛋白被解析成多个不同的聚类集(图1E)。为了验证t-SNE投影中显示的聚类准确地代表了蛋白分布图谱的相似性,而不是建模的伪影,我们用无监督的聚类检测算法 "基于层次密度的空间聚类应用与噪声"(HDBSCAN)分析了未转化的数据。通过HDBSCAN在未转化的数据中发现的簇对应于t-SNE图中观察到的许多簇的核心,支持这些预测的蛋白关联的有效性(图1F)。为了评估这些簇是否代表真正的生物蛋白组合,我们基于以前的位置研究或蛋白功能的有力证据,编制了一组656个已知的标记蛋白,它们属于细胞器、隔室、结构或亚结构(表S3),当投射到t-SNE地图上时,这些标志物根据簇进行排序(图1G)。这些簇代表了所有主要的弓形虫隔室或亚隔室,包括许多顶复门原虫特异性结构,表明hyperLOPIT产生了弓形虫速殖子的高度解析的蛋白组图。这些数据的分辨率可识别膜细胞器(例如线粒体,微膜,内质网,高尔基体);细胞骨架成分(例如,内膜复合物,根尖复合物结构);分子复合物(例如核糖体和蛋白酶体亚基);和小室组织(例如,外部和内部外围以及完整的血浆膜蛋白)。

为了测试hyperLOPIT簇的真实性,我们通过内源基因融合和免疫荧光显微镜检测(IFAs)选择了80个与代表不同细胞器或亚细胞结构的簇相关的蛋白进行表位标记。这些蛋白以前要么是未定性的,要么在某些情况下,临时注释显然与其hyperLOPIT推断的位置相冲突。在尝试的80个蛋白中,有62个蛋白可以被IFA标记并被IFA检测到,并且所有62种蛋白的亚细胞定位与其hyperLOPIT预测一致,进一步支持了hyperLOPIT簇数据与亚细胞生态位的高度相关性(图2和S2)。其余的18种蛋白要么不适合作为基因融合体用于报告基因标签,要么无法被IFA检测到。

图2 HyperLOPIT预测的亚细胞位置的验证

(A)通过免疫荧光显微镜(品红色)标记和检测的未表征蛋白抗原决定簇的实例,该蛋白与命名的标记蛋白(绿色)共存。指示单元格轮廓(虚线)。有关所有已验证的蛋白,请参见图S2。比例尺,10μm。(B)来自(A)的选择蛋白(品红色)与亚细胞标记蛋白(绿色)的光学超分辨率(3D-SIM)图像。箭头指示细胞从后到前的细胞轴。比例尺,1μm。

蛋白簇的解析可以让标记-蛋白分布的监测机器学习方法来预测所有检测到的蛋白的亚细胞位置。将62个新验证的蛋白添加到之前的656个标记中,以提供718个标记,这些标记定义了26个不同的亚细胞生态位。我们基于t增强的高斯混合模型(TAGM)通过最近开发的贝叶斯分类方法对数据进行了分析,以通过概率论的方法将蛋白分配到一组已经定义的类别,这种方法的优点是可以统一计算所有类别的成员概率,这是通过估算蛋白分配到定义的亚细胞类别之一或表示数据中噪声的离群成分的后验概率来实现的。

期望最大化算法用于从已知的718标志蛋白计算TAGM模型参数的最大后验(MAP)估计,我们使用这些模型分析了其余3114种蛋白的丰度分布曲线,并获得了每种蛋白属于已定义的26种最可能的亚细胞类别而不是异常值的可能性。我们在所有26个亚细胞类别中应用了99%的统一定位概率临界值(图3A,3B和S3;表S4A)。在所有三个独立的hyperLOPIT实验中测得的3832个蛋白中,我们将先前未知位置的1916个蛋白分配给26个亚细胞生态位定位概率高于99%的那个,TAGM-MAP没有足够的确定性将剩余的1198个蛋白分配到任何位置(图3B,未分配)。

蛋白在细胞群体中位置的稳固测定忽略了许多蛋白具有的动态行为,包括调节的位置变化,运输中间产物,细胞器接触点和具有多个位置的蛋白,蛋白对多个位置的占有率将在hyperLOPIT数据中表现为复合丰度-分布曲线。为了测试是否可以检测到这些动态蛋白行为,我们使用马氏链蒙特卡洛(MCMC)方法,通过完全贝叶斯TAGM分析,从所有建模的亚细胞生态位的每种蛋白的后定位概率的整体分布中取样(图3C和3D;表S4B和S4C),大多数TAGM-MAP分配的蛋白位置对应于TAGM-MCMC的单个高概率位置关联,与这些蛋白的稳态单个位置一致(图3C),但是,某些TAGM-MAP分配的隔室通过TAGM-MCMC显示了蛋白在多个隔室中的概率分布的富集。例如,许多内在的血浆膜蛋白与内膜囊泡蛋白(图3C和3D)一样,显示出高尔基体的概率增加,相比之下,顶端复合体的分泌细胞器(微线体,杆状体,致密颗粒)是由单一TAGM-MCMC分配为主,这与高尔基体、液泡和质膜之间蛋白的动态双向交换是一致的,而杆状体、微线体和致密颗粒的蛋白组一旦建立起来,在弓形虫的这种生命形式中是静态的,因此,TAGM-MCMC显然能够捕捉到弓形虫空间蛋白组的一些动态特性。

TAGM-MCMC分析还可以对蛋白亚细胞位置进行不确定性定量,特别是那些未被TAGM-MAP分配的蛋白(图3C)。在TAGM-MAP模型中,这些蛋白中的大多数有较高概率属于异常成分(图S3),而TAGM-MCMC报告显示其中大多数很高概率属于亚细胞类别。这些蛋白中的许多是由核和胞质组成的,这可能表明它们在这些生态位进行运输,但是,由于用于维持核和胞质完整性的亚细胞分级分离方法的局限性,我们对这种解释持谨慎态度。剩余的TAGM-MAP未分配蛋白很低可能性属于已定义亚细胞类别之一(图3C),这可能表明这些蛋白的动态定位行为。

图3 通过监督贝叶斯分类将蛋白分配给已知的亚细胞生态位

(A)TAGM-MAP预测蛋白的稳态位置(99%概率)叠加在3,832个蛋白的30plex hyperLOPIT数据的t-SNE投影上。(B)分配给每个位置的蛋白数量。标记蛋白(Mk:先前表征的蛋白+经过验证的蛋白,如图2和S2所示)以深色表示,新分配的蛋白预测(Pd:TAGM-MAP概率为99%)以浅色表示。(C)热图显示了按TAGM-MAP分配的类(行)排序的蛋白对蛋白的联合概率的归属,该联合概率属于TAGM-MCMC推断的26个定义的亚细胞类或异常成分(列)。右侧的彩条显示了TAGM-MCMC定位的不确定性,因为TAGM-MCMC定位概率的95%等值置信区间(以灰色阴影表示)和平均Shannon熵(以红色阴影表示)。(D)小提琴图显示了TAGM-MCMC在26个亚细胞小生境中的定位概率示例分布。TAGM-MAP和TAGM-MCMC预测该蛋白最可能的位置是PM-部分,但定位到高尔基体的可能性也很大,这与在多个小室之间循环的蛋白信号一致。(E)按亚细胞分类的单个位置和多个位置膜蛋白(分别为蓝色和红色)的部分。(F)隔室特定的蛋白电荷分布(计算的pI)显示为Tukey箱图(右侧的图例)。右侧显示了特定类的平均值与数据集平均值不同的概率。

3. HyperLOPIT实现顶复门原虫细胞隔室的广泛蛋白组学解决方案

要解释LOPIT对弓形虫的细胞分辨率,就必须破译细胞器和亚细胞结构的物理破坏和分离方式,这反过来又提供了蛋白和隔室相互之间的物理联系的知识,从而对这种细胞的生化组织有了重要的了解。清楚地定义不同的膜结合区(例如,线粒体,顶端细胞,球棒状体,微米级,致密颗粒,内质网)表明,这些结构是相对完整地从另一个分离,这提供了各自的蛋白组的可靠的鉴定。两个细胞器都被分解为两个簇,其中一个簇富集完整膜蛋白,而另一个则耗尽膜锚定蛋白(图3A,3E和S4A),此分辨率与每种蛋白群体形成的独特的丰度分布图相符:(1)仅与细胞器膜分散的膜附着队列,(2)可溶性队列共享完整细胞器和细胞膜结构的复合体。释放的可溶性蛋白在细胞器破裂中的分布。这种偶然的区别进一步提高了细胞器蛋白组的分辨率和知识水平:与细胞器的膜状成分直接或间接相关的蛋白,以及可溶于细胞器的蛋白和复合物(图S4B)。

内膜复合体(IMC)是顶复门原虫细胞的一个显著特征,它由蛋白网状结构组成,支持贴附在质膜细胞面的扁平膜状小囊(图1A)。IMC是宿主入侵过程中运动的重要平台,维持细胞形状和组织,以及细胞分裂过程中新细胞的形成,一个主要的IMC团簇与质膜团簇分开分离(图3和S1),表明在细胞破裂过程中IMC从质膜上解离了一定水平,IMC棋盘状分布的膜状细胞膜排列在细胞主体的大部分区域,包括占据细胞顶端部分(约10%)的单个圆锥形细胞膜池(顶盖)(图1A)。顶盖的已知蛋白和在其后边界的一系列小环或“环状”与在细胞其余部分看到的IMC蛋白分开分离(图2和3),这表明在细胞破裂过程中,这个边界处会解离,以及环组织比后IMC池更牢固地附着在顶盖上。根尖分辨的蛋白还包括与圆锥体和根尖环相关的所有已知的弓形虫蛋白,这是细胞根尖与入侵相关的结构成分(图2和S2),这些顶端蛋白进一步分解为两个簇,顶端1和2,尽管这似乎不代表空间分化,因为顶端和圆锥处均存在蛋白(图3和S1)。目前尚不清楚这两个簇的hyperLOPIT的解析基础,但我们注意到蛋白的生物物理特性也彼此区分开了:顶端1富含碱性pI,顶端2富含酸性pI(图3F和S4C)。最后,细胞的管蛋白的大部分发生在一堆微管中,支撑和支持IMC(图1A),然而,微管蛋白与一组已知的亚膜微管相关蛋白(MAPs)分开分离,作为第四簇(图3),表明微管蛋白与IMC的亚蛋白膜网络分离。因此,作为顶复门原虫细胞表皮明确的复杂组成部分,IMC被分解为四个亚结构关联的hyperLOPIT簇。

浆膜蛋白组解析为三个生化不同的簇,富含整体膜蛋白(PM-integral)、外叶上的外周蛋白,内/胞叶上以GPI锚定表面抗原糖蛋白(SAG)相关序列(SRS)蛋白家族成员为主(PM-peripheral 1)的外周蛋白(PM-peripheral 2)(图3;表S4),内质网蛋白也显示出亚室的分辨率(图3),而它的一个主要类别(内质网1)富含整体膜蛋白。第二小类酸性较强的可溶性蛋白形成了一个独特的簇(内质网2),其中包括热休克蛋白(BiP、Hsp90和DnaK家族蛋白),以及与蛋白折叠和加工有关的其他几种蛋白(图3E和3F),这为这些寄生虫内质网中的亚室组织提供了新的见解。内质网2蛋白的丰度-分布曲线更类似于顶端细胞的蛋白,而不是内质网1的蛋白(图S1),这表明这两者之间存在一定程度的关联,考虑到大多数细胞顶蛋白通过内质网运输,这种关联可能反映了这些蛋白在将蛋白筛选到细胞顶的时在折叠和氧化还原过程中的作用,的确,最近发现,在由被粘液质存在的硫氧还蛋白TgATrx2下拉的蛋白中发现了BiP。

我们的hyperLOPIT方法的实施是为了分馏和解决亚细胞膜生态位,特别是与入侵和宿主相互作用有关的那些。但是,胞质大蛋白复合物(如蛋白酶体和核糖体亚基)在其余胞质蛋白中脱颖而出,并且实际上是最紧密和分离度最高的簇之一(图3和S1),hyperLOPIT图的这些区域中其他结构的证据(图1E和1F)表明这些复杂空间中蛋白缔合的进一步分解。

4. 隔室蛋白组提供大量的顶复门原虫亚细胞复杂性知识扩展

在hyperLOPIT可以分配到具有强大支持的已知隔室的1,916种蛋白中,有795种(41.5%)以前被指定为“假设蛋白”,其中335种(17.5%)仅被标注为保守的含结构域或重复序列的蛋白,其中256种(13%)标注为通用功能,例如“转运蛋白”或“……家族蛋白”,而对于228(12%)而言,它们分配的功能是“假定的”。这些蛋白中只有302个(16%)表现出更清晰的功能概念,通常是通过蛋白相似性分配给保守的真核蛋白,但其中大多数仍缺乏确定和/或经过实验验证的定位。因此,弓形虫中蛋白位置的hyperLOPIT分配,为我们对亚细胞室和生态位的蛋白组成的认识提供了巨大的进步,包括那些介导寄生虫-宿主相互作用的蛋白(图3B)。

介导寄生虫与宿主相互作用的蛋白隔室是细胞复合体生物学的一个方面,为hyperLOPIT提供了巨大的知识扩展。三种不同的分泌室将蛋白送到寄生虫表面、直接进入宿主细胞质或寄生虫在其宿主细胞内占据的膜室,这些隔室的分泌促进了寄生虫的基本过程:细胞外运动和宿主附着(微线体);渗透和入侵宿主细胞(杆状体);操纵宿主防御、新陈代谢和营养物质的获取(杆状体和致密颗粒);以及最后宿主细胞出口(弓形虫的微线体,疟原虫的外显子),这些功能在寄生虫感染、毒力和疾病中的重要性,使许多研究注意力集中在这些隔间及其蛋白货物上。先前在在每一个微囊、杆状体和致密颗粒中,弓形虫里分别鉴定了29、47和41种蛋白,HyperLOPIT在这三个隔间中分别鉴定出另外的22个、59个和83个蛋白质,其中,它们分别有来自三个细胞器的22、43和49个蛋白缺乏明显的信号肽,否则可能已经预测到了它们在分泌细胞器中的位置,我们测试了其中15种信号肽缺失蛋白,并验证了它们均位于分配的细胞器中(图2和S2;表S3)。

将杆状体分为两个不同的簇,使人们对该细胞器内的细胞生物学分裂有了新的认识:杆状体 1富含可溶物。杆状体 2富含与膜相关的蛋白,从而保证了细胞器的维持和生物发生,甚至捕获了将蛋白筛选到杆状体的最后步骤中的成熟酶过程(例如天冬氨酰蛋白酶3)(表S4A)。众所周知,杆状体将选择的蛋白与后“球茎”中的蛋白分隔为锥形的前颈,这种分离与分泌和功能的时间有关:宿主穿透过程中的颈部蛋白和管理后续感染的球茎蛋白。虽然hyperLOPIT不能区分这些分泌蛋白的种群,但通过显微镜我们对新的杆状体蛋白的定位确实揭示了杆状体的进一步空间组织,一些蛋白仅位于球后部,另一些蛋白则同时标记了杆状体前、后两端。

寄生虫表面也是与宿主相互作用的关键部位。GPI锚定的SAG蛋白是最有名的表面分子,但已知质膜中充当受体和转运蛋白或控制质膜特性和功能的完整膜蛋白相对较少,完整的血浆膜蛋白簇包含110种蛋白,极大地扩展了该蛋白组学的知识(图3)。

5. HyperLOPIT解决了寄生虫细胞内蛋白组表达,功能,适应和进化的细胞内情境

驱动蛋白调节、功能、适应和进化的顶复门原虫细胞器的不同行为和程序以及结构的差异,只能使用不同细胞隔室的蛋白组学样本来解决,弓形虫的hyperLOPIT空间蛋白组为评估这些细胞特性提供了必要的统计能力。

6. 一些隔间显示出严格的转录调控

在弓形虫中,之前的工作是通过细胞周期中转录谱的相关性来确定候选的隔间蛋白,且假设共位点的蛋白是共同表达的,但是,如果不全面了解蛋白组的空间分布,以前不可能对该假设进行客观评估。为了测试隔室相关的转录控制,我们整理了一系列定量转录组数据,并比较了簇内共表达的相关性,以及簇与细胞蛋白组其余部分之间的相关性(图4A)。在几个簇中,簇内共表达有强有力的支持(图4B和S5A;表S5),大蛋白复合物的基因表现出特别强的协同表达:顶端复合物,19S和20S蛋白酶体亚基以及40S和60S核糖体,膜细胞室用于宿主的入侵和相互作用,如微粒体、杆状体和致密颗粒,它们都显示出强烈的协调表达,尽管支持较少,但顶质体和IMC也是如此,其他隔室范围的蛋白组显示较小或没有协调表达的证据(例如可溶性线粒体蛋白)。如果hyperLOPIT分解了细胞器子亚室的蛋白组(例如,杆状体 1和2),则没有证据表明这些子蛋白组之间的基因表达模式有所差异(图S5B;表S5)。

图4 亚细胞隔室内基因表达模式的相关性

(A)根据蛋白位置分析基因共表达的示意图。相对于簇成员与所有其他基因(橙色)之间的这种分布,绘制了簇成员(蓝色)之间的共表达水平分布。(B)选择测量为皮尔逊相关性的hyperLOPIT簇的基因共表达水平。科恩的d值与效果大小描述符一起显示在每个图表上方。

7. 亚细胞蛋白组揭示了细胞的生物物理和功能分区

蛋白特性会适应其运行的环境和过程,因此,来自亚细胞生态位的蛋白组学数据可以报告跨细胞隔室和程序的这些微环境的生化状况。蛋白的pI值通常反映其局部环境的pH值,并且在不同的亚细胞小生境中,蛋白的平均pI值存在明显差异(图3F和S4C;表S6A),这包括通过分泌途径的逐步酸化:从内质网到高尔基体再到膜内囊泡,它还显示了明显的顶质体碱性pH,这种细胞器的特性以前是未知的,并且可以表明pH在蛋白输入中的作用。

我们的数据还报告了跨细胞运输程序和整个细胞膜特性的差异。Sec61复合物是蛋白进入内膜系统的常见入口点,蛋白从中被分类到多个目的地,许多目的地是宿主相互作用的中心,共翻译内质网导入是由内质网导入机制与可切割的N末端信号肽的相互作用介导的。比较来自弓形虫和它们的顶复门原虫直向同源物针对不同内膜生态位的信号肽发现,在不同位置的蛋白组之间具有统计学上显着的组成差异(图5A和S6;表S7B),已知信号肽序列可调节Sec61易位和信号裂解的动力学,两者均会影响折叠和分子伴侣的募集,并且在内质网应激的情况下,信号肽甚至可以选择性地重新排列蛋白以破坏细胞质。我们的数据表明,这些或相似过程在蛋白合成的这些早期阶段为顶复门原虫分泌隔室提供了一定的分类选择。

跨膜蛋白与它们嵌入其中的脂质双层相互作用。对顶复门原虫单跨蛋白跨膜(TM)域长度分布的分析表明,各隔室之间存在明显差异(图5B),这些差异很可能反映了整个细胞中脂质成分的差异,而关于选择蛋白的实验证据表明,TM跨膜长度可以支持顶复门原虫的蛋白筛选情况。我们发现,微粒蛋白与质膜蛋白具有较长的TM跨度,这与分泌后微粒蛋白的目的相契合,相比之下,致密颗粒蛋白并不遵循TM跨度长度随着分泌途径的早期到后期的而增加,致密颗粒蛋白必须避免在分泌后插入寄生虫质膜,其TM跨度缩短的趋势可能有助于它们继续进入宿主体内。

蛋白组在整个亚细胞环境中的相对冗余度也使用我们广泛的隔室蛋白组表示法进行了评估。我们使用来自弓形虫中全基因组CRISPR-Cas9敲除筛选的数据,在体外速殖子繁殖期间测量了表型,将这种遗传筛选与速殖子中蛋白表达的明确证据相结合,可以观察到相对可分配的蛋白与不可缺少的蛋白的不均匀隔室分布(图6A和S7A;表S6D)。在这些条件下,质膜(包括PM-integral),致密的颗粒,微线体,杆状体和IMC对可分配蛋白显示出最大的偏倚(图6A)。因此,这些隔室显然不遵循寄生虫基因丢失和复杂性最小化的普遍趋势,相比之下,其他区域(例如,顶质体)则缺乏可分配的蛋白(图6A),因此,尽管这种细胞器是以前光合作用的生活方式的残余,并且早期被解释为“进化的行李”,但现在很明显,它已经成为高度还原的细胞器,由一个赤裸的基本蛋白组支撑。

图5 根据亚细胞隔室区分蜂胶复合物信号肽和跨膜结构域序列

(A)来自顶复门原虫膜内室的蛋白的信号肽(SP)序列的氨基酸相对位置丰度的差异,显示为锚定在切割位点(位置0)上的徽标图。参见图S6。表S7A和S7B。氨基酸通过理化性质着色。(B)不同隔室的单跨度蛋白的顶复门原虫跨膜(TM)跨度长度的分布。通过Mann-Whitney U检验成对比较长度分布(小提琴图),并将所得的p值(热图)用于聚类膜类型。

8. 异构隔室宿主的适应性反应

人和动物的寄生虫在巨大的选择压力下运作,以成功利用可用的宿主,所有这些都受到宿主免疫系统的不断监测和攻击,作为人畜共患的传染原,刚地弓形虫也适应了利用各种不同的温血生物。蛋白选择性压力的强度和性质通过基因的非同义(dN)点与同义(dS)点突变的比率之比来证明,并且基因dN/dS值的分布决定了细胞内这些压力的分布和跨隔室的寄生虫反应,从62个刚地弓形虫地理分离株的种群数据中跨亚细胞隔室分析了基因单核苷酸多态性(SNP)特性(图6B,6C,S7B和S7C;表S6B和S6C)。dN/dS分布高度正偏斜的隔室是外周血浆膜蛋白,膜的可溶性物质和致密颗粒的隔室(图6B),这意味这些小生态位中的蛋白对变化有很强的积极选择,而且具有较高的耐受变化的能力,这些隔室中的此类蛋白可能位于宿主-病原体相互作用和适应的前端。与外围外部血浆膜蛋白的高变化率形成鲜明对比的是整体血浆膜蛋白的高变化率,它倾向于纯化选择(低dN / dS)(图6B),这些差异揭示了暴露于宿主免疫因子与维持血浆膜功能之间的矛盾,处于纯化选择之下的其他细胞小生态位是那些具有中心细胞功能的小生态位:核糖体,胞质溶胶,非染色质核蛋白,核仁和蛋白酶体(图6B)。

编码序列中的SNP密度也对隔间进化有反应,而且SNP密度与dN/dS相关(例如,血浆膜外围蛋白均高,核糖体均低)(图6C)。然而,对于线粒体可溶性蛋白观察到了意想不到的突变行为,该蛋白表现出明显富集,高于平均SNP密度(图6C),但dN/dS没有增加(图6B),这种同义或“沉默”突变的富集表明了对不同菌株密码子使用变化的选择,这可能对这个重要的代谢隔室中的翻译效率差异和代谢通量控制有影响。虽然在这里也可以看到蛋白序列变化的一些选择(图6B和6C),但在顶质体中也可以看到类似的SNP密度偏差,因此,代谢控制的调节可能是宿主组织和/或分类群偏好甚至跨寄生虫种群的毒力的重要驱动力。

图6 弓形虫亚细胞室显示蛋白组功能冗余,选择压力和遗传多态性的不同分布

(A)蛋白功能冗余的隔室特异性分布,表示为平均基因敲除(KO)表型评分,量化了体外培养期间每个弓形虫基因对寄生虫适应性的贡献(负评分表示相对必不可少的基因;正评分表示表示可有可无的基因)。(B)进化选择压力的隔室特异性分布,表示为非同义和同义突变率的蛋白平均比(dN/dS比)。(C)遗传多态性的隔室特异性分布,表示为每千碱基基因编码序列(CDS)的SNP密度。隔室特定的分布如图3F所示为Tukey箱形图。

9. 顶复门原虫的特定隔室进化轨迹

一个已解析的顶复门原虫空间蛋白组还可以评估顶复门原虫的广泛进化,我们问了一个问题:在这些寄生虫的进化过程中,不同的细胞隔室和功能何时显示出最高的革新率?我们调查了系统发育距离上跨细胞隔室的新蛋白直向同源物的分布(图7;表S8A–S8F),这些数据表明,不同的细胞隔室显示出非常不同的进化蛋白创新速率。正如预期的那样,在最后一个真核生物祖先(LECA)的最古老的水平上,直向同源物富含在核心细胞隔室内,包括用于蛋白表达,分类和更新的胞质溶胶和复合物(图7),相比之下,最近针对球虫的直向同源物最富集的隔室包括致密颗粒,可溶部分,杆状体可溶性部分,微线体,顶点和外周表面蛋白,这些都是细胞与其宿主相互作用的所有组成部分。致密颗粒显示出最大的新颖性,显然对弓形虫及其近亲的近代进化最有帮助。其他细胞位置显示了早期顶复门原虫特有的加速进化,这可能对顶复门原虫作为寄生虫的适应很重要:IMC是寄生虫运动,宿主接触和侵袭的关键,而核染色质簇则是与寄生虫共享的新型基因调控网络的进化相一致。铬绿藻是顶复门原虫最接近光合作用的近亲,它们也与动物群落生活在一起,从这些群体的共同祖先中可以看到整体血浆膜蛋白组学的创新,尤其是丰富的膜转运蛋白,这可能表明了与动物伴侣进行分子交换的开始。线粒体在从鞭毛藻类中分离出来的复合体之前,线粒体甚至发生了更深层,更快速的变化,这与这两个群体共有的这种必需代谢细胞器的许多已知特征是一致的。最后,在囊泡虫类的共同祖先中(包括纤毛虫,由亚膜胞膜囊泡虫(IMC)表皮组织所定义)可以看到新的内叶周围血浆膜蛋白的富集,这些蛋白包括信号级联的几个Ca2+和cGMP受体分子(例如钙依赖性蛋白激酶3,蛋白激酶G),而这些分子对于复合体入侵和宿主逃逸事件至关重要,这是最早在顶复门原虫进化过程中这种细胞超微结构与这种关键功能共同偶联的生化证据。总的来说,这些数据提供了对复合细胞的进化年代及其寄生的轨迹的前所未有的视角。

图7 刚地弓形虫亚细胞室蛋白组揭示了进化过程中室进化的速度

点图显示了在hyperLOPIT定义的顶复门原虫隔室类别中,在十二个系统发育距离水平上,新蛋白直向同源物显着富集的分布。p值(颜色)由代表性不足的超几何测试计算得出,并根据基因比例(在给定的系统发育距离水平下,隔室中的新蛋白相对于所有新蛋白的分数)进行缩放。Toxo./Ham.,Toxoplasma/Hammondia;SAR,stramenopiles/Alveolata/Rhizaria.

讨论

hyperLOPIT在弓形虫胞外速殖子上的应用提供了包括普通隔室和特定隔室在内的复合体细胞的全面高分辨率空间蛋白组图。这些数据揭示了对这些主要人类病原体的生化,功能和进化组织的全面洞悉了解。总体而言,我们鉴定和定量了3832种蛋白,并将2634种蛋白分配给26个不同的亚细胞生态位,贝叶斯后验概率为99%。这些实际上包括所有已知的弓形虫细胞隔室,包括对大多数顶复门寄生虫特异的细胞室。我们研究的直接结果是已知细胞器蛋白组的大规模扩展,对于侵袭性细胞器(微线体,杆状体,致密颗粒)而言,这为弓形虫入侵,生长和外出时分泌到宿主中效应器们产生的复杂效应提供了很多新的知识。我们还捕获了这些细胞器的生物发生和维持过程中涉及的蛋白还发现了IMC的顶端亚结构域的蛋白组的主要新元素和包括锥状体的顶细胞骨架结构,这导致在顶复门原虫中这些结构有更广泛的保守性。由于这些亚细胞生态位在系统发育上仅限于顶复门原虫及其近亲,因此我们对它们生物化学的定义对于理解其功能至关重要。此外,通过将数百种蛋白分配给线粒体和黏膜质体,现在也可以更深入地研究这些原本神秘的内共生细胞器在寄生虫中的代谢能力和活性。

因为hyperLOPIT不受蛋白功能和/或保守结构域,序列基序预测或其他生物中直向同源物的位置的推断的影响,所以它不会遭受这些方法的潜在陷阱,例如,基于序列相似性,ToxoDB:TGME49_310290被注释为“含有染色体浓缩(RCC1)重复序列的蛋白的调控因子”,表明存在核位置。但是,该蛋白已通过hyperLOPIT归入线粒体可溶类别,并通过显微镜进行了验证(图S2),类似地,带注释的“ 杆状体激酶家族蛋白” ROP暗示了杆状体的定位,就像许多此类蛋白一样(例如,ROP11、20、24、26)。但是,一些“ ROP”蛋白(ROP32-35:ToxoDB:TGME49_270920,ToxoDB:TGME49_201130,ToxoDB:TGME49_240090和ToxoDB:TGME49_304740)被hyperLOPIT归因于致密颗粒,此外,蛋白可以随着进化时间的推移在不同的区间重新定位,进一步混淆了基于标准的推论,例如,拟南芥已经扩展了一个线粒体靶向RNA结合蛋白(RAPs)家族,弓形虫编码了16个这样的RAP域蛋白,如预期的那样,它们中的大多数被hyperLOPIT定义成线粒体可溶性类。然而,有一个RAP蛋白(ToxoDB:TGME49_211890),它是Sarcocystida-特异性基因重复的产物,被分配到细胞顶端,这个位置也得到了验证(图S2),虽然RAP蛋白的细胞器功能还有待发现,但这种线粒体蛋白搬迁到细胞顶的现象表明了细胞区间功能的进化转移,这种转移也可能解释了随着寄生虫-宿主相互作用的不断发展,"ROPs "被分散在杆状体和密集的颗粒中。

有几个原因能表明为什么蛋白的一部分没有被有把握地分配到一个亚细胞室。首先,TAGM无法模拟未知的亚细胞生态位或那些缺乏足够的已知蛋白作为标记物的亚细胞生态位,在这种细胞生态位中出现的蛋白将被错误地归入概率较低,或异常隔室的已知簇之一;其次,对于非常低丰度的蛋白,测量的丰度分布曲线可能会受到低信号的噪声的干扰,然而,我们注意到,许多蛋白甚至低于通过western blot或IFA检测到的水平,仍可重复地通过hyperLOPIT进行量化和分配。最重要的是,hyperLOPIT方法报告了蛋白的稳态位置;然而,一些蛋白质分布在多个细胞器之间,不能明确地分配到任何类别。我们发现,不确定分配比例最大的是细胞质和核蛋白簇之间,以及高尔基、内膜小泡、PM-integral和PM-peripheral 2之间,前者可能是因为许多蛋白在胞浆和核之间穿梭,也可能是细胞破坏和分馏方法破坏了核的完整性,后者可能反映了分泌途径的内膜隔室的内在异质性和动态性。

然而,这种全面而无偏见的空间蛋白组学为发现先前未表征的亚细胞生态位提供了机会。t-SNE投影表明,在这些图谱的区域中,除了缺乏针对这些聚类的已知标记物以外,TAGM分析无法访问的结构都具有相当大的规模,数据的无监督分析(HDBSCAN)在这里支持进一步的真正蛋白关联,这提供了发现以前未被识别的细胞组织的路线。

对亚细胞蛋白组的研究往往集中在识别可以阐明细胞隔室的功能和分子机制过程上,事实上,这些hyperLOPIT数据现在为这些重要的追求提供了无数的机会。此外,结合基因筛选,通过CRISPR-Cas9和现代DNA测序方法,hyperLOPIT数据提供了一种手段来解释这些在亚细胞背景下的筛查结果,然而,现在也有巨大的机会来了解更广泛的细胞功能,适应和进化的过程,通过使用这些客观全面的细胞组成组织的样品与其他系统水平的数据相结合,例如,基因表达分析揭示了一些大分子复合物和与入侵相关的结构的紧密表达程序,这些程序可能有助于这些对致病性至关重要的装置的有序组装。此外,全细胞范围内选择性压力及其响应的分布,表现为跨隔室的基因dN / dS和SNP频率的种群水平偏斜,显示了这些寄生虫如何不均匀地发生对这个时代的适应,变化最快的蛋白富含寄生虫,致密颗粒以及在寄生虫表面,这些很可能确定了与宿主-寄生虫攻防竞赛最相关的分子过程。但同样重要的是,这些数据揭示了这些隔室中的蛋白不会改变,并且可能为针对这些寄生虫核心过程的治疗策略提供稳定的靶标。最后,关于进化时间不同细胞室中创新的相对时间和创新速度,可以提出更深层的进化问题,这些揭示了从早期到晚期,在细胞内信号传导级联,新陈代谢,细胞外界面,遗传网络,运动性,侵袭以及最终宿主重塑的功能发展方面的一系列创新。我们的分析还确定了负责这些关键情况的蛋白(表S8F),防治顶复门原虫,需要理解它们作为寄生虫进化的基本原理,以及现代适应性和分子功能的细微差别,这些关于顶复门原虫的高分辨率空间蛋白组学数据,为我们对这些关键人类病原体的理解和方法提供了新的理解和处理方法。

原文链接:  

https://pubmed.ncbi.nlm./33053376/


   



    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多