分享

8+双疾病+转录调控+分子对接生信思路,珍藏起来!

 智汇基因 2023-02-06 发布于广东

导语

今天给同学们分享一篇共病的生信文章“Discovering common pathogenetic processes between COVID-19 and sepsis by bioinformatics and system biology approach”,这篇文章于2022年8月31日发表在Front Immunol期刊上,影响因子为8.786。COVID-19是由SARS-CoV-2引起的急性呼吸道传染病,已在全球范围内迅速传播,导致大流行且死亡率很高。在临床实践中,许多COVID-19重症或危重症患者出现典型的脓毒症相关临床表现,包括多器官功能障碍综合征、凝血功能障碍和感染性休克。研究的目的是通过生物信息学和系统生物学方法分析这两种疾病之间的潜在分子机制,提供对COVID-19发病机制和新疗法开发的新见解。

图1 研究流程图

1. 鉴定COVID-19和脓毒症之间的共同转录特征

重症COVID-19患者可能会出现全身炎症反应综合征(SIRS),如果炎症恶化可能会发展为脓毒症。为了检查COVID-19和脓毒症之间的相互关系和影响,从GEO分析了人类RNA-seq数据集和微阵列数据集,从COVID-19数据集中共获得1855个DEG,包括1206个上调DEG和649个下调基因。此外,通过差异表达分析,在脓毒症血液数据集中共鉴定出1086个DEGs,其中481个基因上调,605个基因下调。图1中的两个火山图直观地展示了COVID-19和脓毒症转录基因表达的全貌,其中红色和蓝色圆点分别表示具有显着差异的上调和下调基因(图2A、B)。此外,作者使用热图分别展示了COVID-19和脓毒症数据集中不同样本中前20个DEG的聚类分析和表达分析结果(图2C、D)。COVID-19的前20个DEG包括HIST1H2AK、OLR1、SELL、ZBTB10、DUSP8、CREBRF、PLD6、BHLHE41、ZNF57、ZNF77、BCL2A1、IFITM2、ARRDC3、CLK1、HIST2H2BE、NFIL3、ZNF267、SERTAD2、ZNF292和ZNF12。在脓毒症发现集中,前20个DEG是ABLIM1、LRRN3、EPHX2、NMT2、THEM4、GATA3、CD96、PLEKHA1、DYRK2、PID1、P2RY10、C2orf89、NELL2、LEF1、S100A8、S100A12、C5orf32、ARG1、C19orf59和ANXA3。鉴定这些具有显着差异表达的基因,可以帮助作者获得研究疾病发生发展的关键切入点,进而有助于理解疾病的潜在机制,获得新的治疗靶点。从COVID-19和脓毒症数据集中识别出总共151个常见的DEG(图4A)。差异表达分析结果表明,COVID-19与脓毒症之间存在一些机制共性和相互作用。

图2 差异表达基因

2. 通路富集分析

为了进一步了解这些常见DEG所涉及的生物学功能和信号通路,作者实施了KEGG通路富集和GO功能分析。前15条重要途径用气泡图显示(图3A)。从KEGG通路分析结果来看,这151个常见的DEGs主要富集在感染/炎症性疾病相关和免疫反应相关通路,例如金黄色葡萄球菌感染、炎症性肠病、细胞因子-细胞因子受体相互作用通路和NF-kappaB信号通路。众所周知,COVID-19和脓毒症均与机体炎症和免疫反应相关,在这两种疾病的发生发展过程中发挥着重要作用,与患者的治疗效果和预后密切相关。作者的通路分析结果还表明,免疫相关通路,即细胞因子-细胞因子受体相互作用,是最显着富集的通路(图3B),表明这些常见的DEG可能通过免疫相关的生物学功能或信号传导影响疾病的通路。

图3 通路富集分析

GO分析分为三部分:MF、BP和CC。图3C分别显示了MF、BP和CC的前10个GO通路。具体分析发现,BP的前10个GO项均与免疫功能相关,如T细胞活化、淋巴细胞分化、单核细胞分化和细胞因子产生的负调控。有趣的是,大多数BP通路与T细胞免疫功能相关。此外,CC的结果表明,这些常见的DEGs主要参与细胞内颗粒的形成或释放,例如三级颗粒、特异性颗粒、特异性颗粒腔和细胞质腔囊泡。先前的研究表明,三级颗粒和特定颗粒与人类成熟中性粒细胞的功能相关,包括中性粒细胞的分化和促炎作用。在炎症期间,嗜中性粒细胞被激活并分泌部分颗粒内容物,这些颗粒内容物具有细胞毒性,部分是造成与嗜中性粒细胞组织浸润相关的附带损伤的原因。此外,MF分析结果表明,MF项也主要与免疫反应相关,包括免疫受体活性、免疫球蛋白结合和IgG结合。图3D显示了五个最重要的GO通路与富集的DEG之间的相关性,包括淋巴细胞分化负调节细胞因子正产生调节白细胞-细胞粘附T细胞激活,所有这些都是免疫相关的分子功能。与KEGG分析提示的结果类似,这些常见的DEG可能涉及机体的免疫相关功能和通路,进而影响COVID-19的疾病进展。

3. 关键基因的蛋白质互质作用网络分析与鉴定

PPI网络的评估和分析有助于获得影响细胞和系统生物学功能的关键蛋白质(45)。基于在线分析网站STRING,构建了源自共享DEG的蛋白质的PPI网络,以描绘COVID-19与脓毒症之间的功能和物理相互作用。常见DEG的PPI网络包括151个节点和322个边,如图4C所示。如图所示,圆圈的大小和颜色深浅表示蛋白质相互关联的程度,与关键蛋白质的连接越多,关系越强,说明其重要性。通过使用Cytoscape的cyto关键ba包,前30个(19.87%)DEG被认为是最有影响力的基因。前30个影响基因包括ITGAM、FCGR3A、S100A12、FCER1G、FCGR1A、LY86、IL1RN、C3AR1、LCN2、BCL6、CAMP、RGS18、CXCR4、CLEC5A、SOCS3、CD1D、FGL2、GPR29、AQP9、CLEC4D、CD74、TNFSF13B、CD24、LTF、HCST、MPEG、CR1、MMP8、MS4A4A和FCGR1B。从常见的DEG中识别关键基因有助于作者获得更多关键特征,以发现潜在的生物标志物(图4B)。

图4 PPI网络

从关键基因的子模块网络来看,ITGAM与之相关的蛋白质最多,因此在进一步的研究中,ITGAM在COVID-19中的生物学作用被重点探索其潜在机制在疾病的发生和发展过程中。此外,通过基因共表达网络分析(GCNA)构建了ITGAM与其他基因的共表达网络(图5B)。GCNA结果显示ITGAM与156个基因显着相关,图4B仅显示前11个重要基因,包括TGFBR3、NMNAT1、RHOU、PLEKHG5、MAP3K8、ZCCHC17、DCAF6、CTNNBIP1、SRP9、F5和S100A2。其中TGFBR3、RHOU、MAP3K8、SRP9和F5与ITGAM表达呈正相关,其余6个基因与ITGAM呈负相关。由于GCNA,共表达基因通过不同途径介导ITGAM的表达和功能,ITGAM在体内发挥多种生物学作用。在GO通路中,GSE147507数据集中的GSEA分析显示,高表达ITGAM的样本主要富集在一个重要的免疫相关生物过程中,即适应性免疫反应。其他涉及的GO通路包括角化、表皮细胞分化、表皮发育和角化(图5C)。在KEGG通路中,受高表达ITGAM影响的前5位信号通路是细胞因子受体相互作用、移植物抗宿主病、利什曼原虫感染、系统性红斑狼疮和I型糖尿病(图5D)。此外,根据ITGAM的平均表达水平,将GSE14750数据集中的COVID-19样本分为高表达组和低表达组。为了探索ITGAM高表达组和低表达组之间的免疫细胞浸润程度以了解潜在的免疫机制,使用“CIBERSORT”R包分析了两组之间22个免疫细胞的浸润水平。“CIBERSORT”分析结果显示,ITGAM高表达组和低表达组之间的静息NK细胞、活化NK细胞和嗜酸性粒细胞存在显着差异(图5E)。有趣的是,作者的结果表明ITGAM与活化的NK细胞呈正相关,但与静息NK细胞呈负相关(图5F)。最后,分析了ITGAM高表达组和低表达组的免疫检查点表达水平,发现共有16个免疫检查点基因差异表达,包括ICOS、PDCD1、CD28、TNFRSF4、CD48、LAIR1、LGALS9、CTLA4、HHLA2、TNFSF15、TNFRSF18、LAG3、ADORA2A、ICOSLG、TNFRSF9和CD200R1(图5G)。其中,研究结果提示14个免疫检查点(TNFRSF4、CD48、TNFRSF18、CD70、HHLA2、BTLA、ICOSLG、TNFRSF9、CTLA4、LGALS9、PDCD1、TNFSF15、LAIR1、ADORA2A)与ITGAM呈正相关,而CD276和TNFRSF25与ITGAM呈负相关(图5H)。

图5 关键基因的鉴定

4. 基于常见DEGs的疾病诊断与风险模型构建

通过以上分析发现,COVID-19和脓毒症的共同DEGs可能通过不同的功能和途径影响COVID-19的疾病进程,因此,作者基于151个共同的DEGs,筛选并构建了诊断模型和风险。具体地,实施RF分析以选择关键DEG,并根据变量重要性排序选择前八个重要的DEG进行模型构建(图6A,B)。图6C直观地显示了这八个关键基因在COVID-19和正常样本中的表达水平。接下来,基于八个关键特征,在训练集中构建了针对COVID-19的疾病诊断模型(图6D、E)。此外,GSE196822数据集被用作验证队列以进一步评估此ANN模型的性能,并发现它在验证集中表现良好(图6F)。上述诊断模型对COVID-19具有良好的判别能力,希望应用于临床,辅助COVID-19的临床诊断。此外,通过使用上述八个关键特征基因成功建立了COVID-19疾病风险评估列线图,以便于使用(图6G)。然后,使用校准曲线初步评估了此列线图的准确性,结果显示偏差校正曲线与理想曲线(图6H)吻合良好。此外,DCA曲线和临床影响曲线(图6I,J)均表明风险模型具有良好的性能。

图6 使用随机森林(RF)从常见差异表达基因(DEG)中筛选特征基因

5. 转录水平调控网络的构建

为了识别转录水平发生的实质性变化并深入了解常见的DEG,采用了一种基于网络的方法来解码调节性转录因子和miRNA。DEG-TFs交互网络是通过使用TarBase和miRTarBase碱基识别的,并显示在图7中。圆圈代表常见的DEGs,而菱形是TFs。圆形或菱形节点的大小取决于节点的度数。节点的度是该节点与网络中其他节点的连接数。度数较高的节点被认为是网络的重要枢纽。从图7中,FCGR1B、BCL6、CD1D、MS4A4A和LTF在更高表达的DEG中更多,因为这些基因在TF-基因相互作用网络中具有更高的程度。如FOXC1、YY1、GATA2、PPARG和FOXL1等TF比同一图中显示的其他TF更重要。同样,图8代表了miRNA调节剂与常见DEG的相互作用。在图8中,红色方块代表miRNA,而蓝色圆圈代表DEG。作者的结果表明,SOCS3、BCL6、CXCR4和TNFSF13B是该网络的关键基因,其中五个基因最常参与miRNA。此外,从miRNA-基因相互作用网络中检测到重要的关键miRNA,即hsa-mir-27a-3p、hsa-mir-26a-5p、hsa-mir-124-3p、hsa-mir-146a-5p和hsa-mir-20a-5p。

图7 转录水平调控网络

图8 构建DEGs-miRNAs相互关联的调控相互作用网络

6. 识别疾病关联

不同疾病可以相互关联或关联的情况是它们通常必须具有一个或多个相似基因。从基于DisGeNET平台的基因-疾病关联分析中,注意到肝硬化、类风湿性关节炎、高血压病、过敏性接触性皮炎、系统性红斑狼疮、贫血、超敏反应和流感与作者报告的关键基因最协调,甚至在COVID-19中(图9)。有趣的是,研究结果显示,上述大部分疾病都与体内的炎症或免疫反应有关。基因-疾病关联表明某些疾病在进展过程中可能具有相同的分子机制。

图9 基因-疾病关联网络代表与常见差异表达基因(DEG)相关的疾病

7. 确定COVID-19中的候选药物和靶标-化学相互作用

化学-蛋白质相互作用网络是了解蛋白质功能的重要研究工具,有助于推进药物发现。在COVID-19和脓毒症中作为潜在药物靶点的常见DEG方面,使用Enrichr基于DSigDB数据库中的转录组特征识别候选药物。根据p值选择的前10名药物分子被认为是可用于COVID-19治疗和后续分析的潜在化合物。这10种可能的药物分子包括头孢林、甲苯咪唑、维甲酸、黄体酮、依米丁、洋地黄毒苷、曲古抑菌素A、胡椒碱、特非那定和strophanthidin。这些潜在的药物被推荐用于常见的DEGs,这是一种治疗两种疾病的常见化合物。

此外,还实施了分子对接以预测这10种潜在化合物与COVID-19的五个不同靶标(包括ACE2、3CLpro、Mpro、PLpro和RdRp)的结合模式。一般认为配体与受体结合的稳定能越低,作用的可能性越大,大部分化合物的结合能符合标准。图10显示了与这5个COVID-19靶标结合的前3个潜在化合物的结合差异。生物活性化合物黄体酮、依米丁和洋地黄毒苷是ACE2上最有希望的化合物,依米丁、孕酮和头孢碱是3CLpro上最活跃的化合物。对于主要蛋白酶(Mpro),最有前途的化合物包括黄体酮、头孢碱和依米汀。此外,最有可能与PLpro结合的化合物是孕酮、头孢林和特非那定,而孕酮、依米汀和维甲酸对RdRp的活性最强。有趣的是,发现依米汀在与四个靶标(ACE2、3CLpro、Mpro和RdRp)的结合位点具有较低的稳定能,而黄体酮可以稳定地结合所有COVID-19靶标,所有结合能≤−6.5kcal/mol。因此,这两种药物可能是治疗COVID-19最有潜力的化合物,需要进一步研究这两种化合物的药理作用。

图10 分子对接

总结

COVID-19和脓毒症与正常对照的转录组数据是从公共数据库下载的,然后分别用于查找这两种疾病的DEG。从151个共享DEG中筛选出前30个关键基因。基于这151个DEG,探索了这两种疾病通常涉及的KEGG通路和GO功能。结果表明,它们主要参与感染和免疫相关通路和功能。为了了解常见基因之间的相互作用,描绘了PPI网络以显示这151个DEG是如何相互作用的。基于关键基因提取的结果,ITGAM被认为与其他基因的相互作用程度最高,可能是这两种疾病中最关键的潜在基因。相关基因参与细胞因子、抗宿主移植疾病、感染等免疫相关通路。同时还与NK细胞和嗜酸性粒细胞的浸润程度有关。此外,还有16个与之相关的免疫检查点,是治疗新冠病毒和败血症的潜在靶点。然后利用这些DEGs筛选出8个关键基因,建立了针对COVID-19的人工神经网络预测模型,其AUC高达0.998,表明该模型表现非常好。同时,建立了列线图来预测COVID-19的风险。为了了解这些DEG在转录水平上的作用,建立了DEG的TF基因相互作用网络和miRNA基因相互作用网络,以发现关键的TF和miRNA。然后了解了与这些DEG最相关的疾病,主要是免疫相关疾病,这表明可以从这些疾病的发展角度挖掘与新型冠状病毒治疗相关的有效信息。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多