分享

7+非肿瘤生信结合pcr验证,思路简单易重复,适合生信小白模仿学习!

 公号生信小课堂 2023-08-01 发布于广东

大家好!今天给大家介绍一篇非肿瘤的的生信文章。本文主要方法包括DEG的功能富集分析、自噬相关DEGs的获取、PPI网络分析和体外qPCR验证。此外,作者还进行了免疫细胞浸润分析和lncRNA-miRNA-mRNA网络构建,并研究了IDD中免疫细胞浸润与ceRNA网络的相关性。

关于非肿瘤生信,我们也解读过很多,主要有以下类型
1 单个疾病WGCNA+PPI分析筛选hub基因。
2 单个疾病结合免疫浸润,热点基因集,机器学习算法等。
3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
4 基于分型的非肿瘤生信分析
5 单细胞结合普通转录组生信分析

目前最新的机器学习思路是使用100多种机器学习组合进行建模或者筛选关键基因,这种方法在肿瘤中已经发表多篇1区文章,例如
最新1区8+纯生信,结合10种机器学习算法构建模型,换个肿瘤可重复!
如果这种思路在非肿瘤中使用,势必会给文章提高档次!目前非肿瘤生信发文的门槛较低,有需要的朋友欢迎添加小编微信咨询

摘要

背景:椎间盘退变(IDD)是老年人最常见的健康问题之一,也是下腰痛(LBP)的主要致病因素。越来越多的研究表明IDD与自噬和免疫失调密切相关。因此,本研究的目的是确定IDD中自噬相关的生物标志物和基因调控网络以及潜在的治疗靶点。

方法:从GEO数据库下载数据集GSE176205和GSE167931获得IDD的基因表达谱。随后,进行差异表达基因(DEGs)分析,KEGG分析,GO和基因集富集分析(GSEA),以探讨DEGs的生物学功能。然后将差异表达的自噬相关基因(DE-ARGs)与自噬基因数据库取交集。利用DE-ARGs蛋白质-蛋白质相互作用(PPI)网络筛选hub基因。证实了hub基因与免疫浸润的相关性以及hub基因调控网络的构建。最后,使用定量PCR(qPCR)来验证中枢基因在大鼠IDD模型中的相关性。

结果:本研究获得了636个富含自噬途径的DEGs。研究结果显示,30个DE-ARGs中6个枢纽基因(MAPK8、CTSB、PRKCD、SNCA、CAPN1和EGFR)是使用MCODE插件鉴定的。免疫细胞浸润分析显示,IDD中CD8+T细胞和M0巨噬细胞的比例增加,而CD4+记忆T细胞、中性粒细胞、静息树突状细胞、卵泡辅助T细胞和单核细胞的数量则少得多。随后,使用15个长非编码RNA(lncRNA)和21个microRNA构建了竞争性内源性RNA(ceRNA)网络。在qPCR验证中,两个枢纽基因MAPK8和CAPN1与生物信息学分析结果一致。

结论:本研究确定MAPK8和CAPN1是IDD的关键生物标志物。这些关键枢纽基因可能是IDD潜在的治疗靶点。

图 1 研究流程

差异基因识别

将两个高通量测序数据集GSE176205和GSE167931标准化并合并为一个数据集用于本研究。然后在数据分析之前对合并数据集进行批量效应消除(图2A、B)。使用用于R中的差异基因分析的limma包从组合数据集获得总共636个DEG,其包含468个上调的基因和168个下调的基因(图3A、B)。所有DEG见补充表S3。

图 2 GEO数据库预处理。

图 3 与IDD相关的mRNA的差异表达

差异基因的富集分析

为了进一步探究这些筛选出的DEGs潜在的生物学变化,使用DAVID在线数据库进行KEGG和GO富集分析,并导出到R中进行可视化。KEGG结果显示,DEGs主要富集于肌萎缩侧索硬化症、冠状病毒病(COVID-19)、志贺氏菌病、沙门氏菌感染和内质网中的蛋白质加工。前15个KEGG通路大多集中在免疫相关疾病(图4A、B)。GO BP注释结果显示,差异基因主要富集在染色质组织、蛋白质自磷酸化和自噬。前15个GO生物学过程显示DEGs与自噬(图4C、D)密切相关。

图 4 DEGs的功能富集分析。

GSEA富集分析

将基因集h.all.v2022.1.Hs.symbols用于GSEA分析。在排除无统计学显著性的结果后,MIT0TIC_SPINDLE、IL2_STAT5_SIGNALING、TNFA_SIGNALING_VIA_NFKB和UV_RESPONSE_DN在IDD中显著活化(图5),表明这些生物过程可能与IDD密切相关。

图 5 GSEA富集分析

DE-ARG的鉴别

为了进一步探索IDD中的自噬相关基因(ARG),作者将从MsigDB数据库获得的404个ARGs与从人类自噬数据库获得的232个ARGs结合起来,总共获得了547个ARGs。然后将ARGs与DEGs相交,获得30个DE-ARG(图 6A)。以p<0.05为阈值在DAVID数据库中对DE-ARGs进行KEGG和GO分析,并在R中可视化富集结果(图 6B、C)。

图 6 自噬相关差异表达基因的鉴定。

PPI的构建及hub基因的鉴定

使用中等置信度的STRING数据库探索了30个DE-ARGs之间的相互作用,并获得了包含30个节点和24条边的PPI网络(图7A)。使用Cytoscape的内部分析插件MCODE,过滤DE-ARGs的PPI网络以获得具有最高聚类分数的子网络用于可视化(图 7B)。如图所示,作者假设MAPK 8、CTSB、PRKCD、SNCA、CAPN 1和EGFR是hub基因。组合数据集中这六个hub基因的热图和3D PCA图揭示对照组与IDD组显著不同(图7 C、D)。在GSE176205和GSE167931数据集中,六个hub基因的AUC值高于0.75,表明六个hub基因具有优异的诊断性能,并且可以用作IDD诊断中有希望的生物标志物(图7 E)。

图 7 DE-ARGs中 hub基因的筛选。。

IDD免疫细胞浸润的变化

使用CIBERSORT算法评估了正常和IDD样本中浸润免疫细胞亚型的相对丰度。条形图和热图显示每个样品中多种免疫细胞亚型的浸润(图8A)。小提琴图显示两个样本组之间免疫细胞百分比的差异(图8B)。与正常样品相比,IDD样品显示CD8+T细胞和M0巨噬细胞的浸润增加,而CD4记忆静息T细胞、中性粒细胞、静息树突状细胞、滤泡辅助T细胞和单核细胞显示浸润减少(图8C)。最后,热图揭示了hub基因与免疫细胞浸润之间的相关性(图8D)。如图所示,hub基因的表达与跨亚型的免疫细胞浸润显著相关。IDD样品中减少的CD4记忆静息T细胞与高表达的CAPN1和EGFR负相关,与MAPK8、CTSB和PRKCD表达正相关。

图 8 IDD和对照组之间细胞浸润。

Hub基因潜在mRNA-miRNA-lncRNA(ceRNA)网络

为了揭示这六个hub基因的潜在转录后调控机制,作者筛选了IDD发展过程中差异表达的miRNA和lncRNA,并构建了一个ceRNA网络。GSE167199的DE-miRNA和DE-lncRNA在R软件中使用limma包进行鉴定和筛选,其中|log2FC|>1和p< 0.05设定为显著性阈值。鉴定了总共139种DE-lncRNA和65种DE-miRNA(图9A、B)。随后,使用ENCORI在线数据库预测六个hub基因靶向的miRNA,并与DE-miRNA相交以获得mRNA-miRNA结合对。此外,使用mirNet数据库预测上一步骤中筛选的DE-miRNA的可能结合lncRNA,并将预测的lncRNA与DE-lncRNA交叉以构建miRNA-lncRNA结合对。然后整合mRNA-miRNA和miRNA-lncRNA结合对以构建六个中枢基因的ceRNA网络(图9 C、D)。

图 9 构建6个hub基因的ceRNA网络。

Hub基因的验证

NP组织切片的X射线、MRI和H&E染色显示IDD大鼠模型中NP严重受损(图 10A)。RT-qPCR分析显示,IDD模型中聚集蛋白聚糖(aggrecan)和Ⅱ型胶原蛋白(COL-2)的mRNA水平降低(图 10B)。作者检查了IDD模型中枢纽基因的mRNA表达。结果显示,与其他hub基因不同,只有CAPN1和MAPK8的表达与DEGs分析结果一致(图 10C)。此外,作者还使用p< 0.05作为筛选阈值(图10D)。因此,CAPN1和MAPK8被验证为IDD进展中的最终hub基因。

图 10 hub基因在正常大鼠和IDD模型中的表达水平。

结论

综上所述,在本研究中,作者利用生物信息学方法分析了IDD的DEGs,包括DEG的功能富集分析、自噬相关DEGs的获取、PPI网络分析和体外qPCR验证。此外,作者还进行了免疫细胞浸润分析和lncRNA-miRNA-mRNA网络构建,并研究了IDD中免疫细胞浸润与ceRNA网络的相关性。在动物实验中,他们在mRNA水平上验证了两个hub基因(MAPK8和CAPN1)的表达,这与生物信息学分析的结果一致。本研究为IDD的发病机制提供了新的见解,并有助于确定IDD发病机制中新的潜在治疗靶点。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多