分享

应用机器学习和神经网络模型识别结直肠癌“炎癌转化”过程的关键基因及防治中药预测

 Symphonizz0jez 2023-10-05 发布于江苏
图片

图片

  

结直肠癌是全球发病率和死亡率较高的恶性肿瘤之一,尽管诊断和治疗技术的进步已经显著提高了结直肠癌患者的生存率,但对于疾病的早期诊断和有效预测仍然存在挑战。尤其是炎症和癌症之间的紧密关系引发了科学家对于炎癌转化机制的深入研究[1]。炎症性肠病(inflammatory bowel diseaseIBD)是一组包括克罗恩病(Crohn’s diseaseCD)和溃疡性结肠炎(ulcerative colitisUC)在内的慢性炎症性肠道疾病[2]。近年来,越来越多的研究表明,炎症性肠病与结直肠癌发生的风险密切相关,其中炎症环境对结直肠癌的“炎-癌”转化过程具有重要影响。在这个过程中,炎症反应激活了一系列的信号转导途径,影响了细胞的生长、分化和存活,最终导致了肿瘤的形成[3]。然而,这些过程中的关键驱动因素和具体机制仍不完全清楚。因此,通过对结直肠癌炎症-肿瘤转化过程的深入研究,了解其分子基础,对于发现新的预防和治疗策略具有重要的实际意义。

在中医药的理论体系中,“未病先防”是一种重要的治疗理念,其主张在疾病尚未发生之前采取预防措施,旨在提高人体自身的抵抗能力,防止疾病的发生[4]。近年来,西医领域对疾病的理解也逐渐转向这一思路,尤其是在癌症研究中,防控癌症早期发生的研究得到了广泛关注。结直肠癌的“炎-癌”转化过程,即长期存在的慢性炎症状态可能诱导结直肠正常细胞向恶性转化,进而形成肿瘤。对这一过程的深入理解,对于防治结直肠癌具有重要的实际意义。
尽管近年来对于这种“炎-癌”转化的研究取得了一些进展,但其具体的分子机制和关键调控因子仍不完全清楚。为了深入理解这一过程,本研究采用机器学习算法对大规模的转录组数据进行分析,以期找到在结直肠癌“炎-癌”转化过程中的关键分子,并对这些分子在疾病进程中的作用进行深入探讨,最后通过核心基因对关联中药进行预测。本研究希望为结直肠癌的临床诊断和中医药的治疗提供潜在的生物标志物和药物靶点。
1 材料与方法
1.1 数据获取
本研究所有数据均来源于公共数据库,利用基因表达数据库(Gene Expression OmnibusGEO)的2个数据集筛选差异基因,GSE66407用于溃疡性结肠炎炎症期患者与正常非炎症患者差异基因筛选;GSE166925用于溃疡性结肠炎患者与结直肠癌患者间的差异基因筛选。肿瘤基因图谱(Cancer Genome AtlasTCGA)数据库中的结直肠癌数据集用于机器学习及神经网络模型中的基因筛选,因正常样本数目与肿瘤样本数差异较大,本研究引入基因-组织表达(Genotype-Tissue ExpressionGTEx)数据库补充正常患者样本,使用R语言中的sva[5]去除批次效应用于后续分析;GSE44076作为外在验证集验证神经网络模型的准确性及后续的免疫浸润分析。
1.2 差异基因筛选
Limma[6]DEseq2[7]分别用于GSE66407GSE166925中差异基因的筛选,筛选阈值设定为log2FC1P0.05ggVennDiagram[8]ggplot2[9]包用于绘制Venn图显示正常结肠-溃疡性结肠炎-结直肠癌转化过程中的差异基因,以Venn图形式展现“炎-癌”转化过程中关键分子的交集情况。
1.3 交集基因富集分析及关键基因蛋白质-蛋白质相互作用网络protein-protein interactionPPI网络构建
为了深入探究在结直肠癌炎症至癌变转化过程中所涉及的细胞通路和分子过程,对在这个过程中的交集差异基因进行基因本体(gene ontologyGO)和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomesKEGG)富集分析,R语言中的clusterProfiler软件包用于基因的富集分析。
GO分析中,从生物过程(biological processBP)、分子功能(molecular functionMF)以及细胞组成(cellular componentCC3个层面展现富集情况。KEGG分析是为了了解差异基因在各类生物通路中的作用和位置,尤其是在癌症相关通路中的角色。以上2种分析都采用了超几何检验(hypergeometric test)来确定某一GO功能或KEGG通路的富集是否显著,并计算其显著性水平(P)。富集分析过程由R语言clusterProfiler[10]包实现。
在差异表达基因导入STRINGhttps:///)数据库进行PPI分析,将物种设置为“homo sapiens”(人类),并选择相互作用得分大于0.4的基因。随后,使用Cytoscape进行PPI网络的可视化。由于网络过于复杂,不便直接展示,因此使用CytoHubba插件[11]来筛选出PPI网络中度(degree)值前30的核心基因用于后续筛选过程。
1.4 机器学习算法筛选结直肠癌炎癌转化过程的生物标志物
机器学习是基于数据构建的计算模型,具有良好的可解释性。在获取结直肠癌炎癌转化2个阶段的核心基因后,采用机器学习算法来进一步进行基因筛选。选用3种不同的机器学习算法进行分析,分别是梯度提升机(gradient boosting machineGBM)算法、随机森林(random forestRF)算法和决策树(decision treeDT)算法,设定“feature importance”(特征重要性)大于2用于筛选机器学习模型中的重要基因。
1.5 神经网络模型预测结直肠癌的发生
使用神经网络模型来构建预测结直肠癌发生的模型。神经网络是一种模仿人脑神经元工作机制的复杂模式识别模型,其可以从输入数据中学习并做出预测。在本研究中使用了前馈神经网络(feedforward neural networkFNN),这是一种常见的神经网络模型,其中信息的传递只能从输入层向前到隐藏层,再向前到输出层,不存在反向的信息传递。
使用TCGA联合GTEx的数据集作为神经网络模型训练集,包含453个肿瘤样本,349个正常样本,输出模型的准确性及受试者工作特征(receiver operator characteristicROC)曲线;利用GSE44076(包含98个结直肠癌肿瘤样本及50个正常样本)作为外在验证集进行神经网络模型的验证。借助于neuralnet R语言包,搭建了人工神经网络模型。首先执行数据预处理,目标是实现数据的规范化。接着,选用范围在[01] min-max方法,将数据进行分离缩放,这是在训练神经网络前的重要步骤。随后,对数据的最大、最小值进行标准化处理,并将神经网络的隐藏层设定为5层。
1.6 关键基因与肿瘤细胞中的免疫浸润关联性分析
为了深入了解筛选出的预测标志物在肿瘤细胞中的免疫浸润情况,利用GSE44076的表达数据进行单样本基因集富集分析(single-sample gene set enrichment analysisssGSEA),将核心基因的表达模式与已知的免疫细胞基因组特征进行比较,来评估核心基因在肿瘤免疫细胞中的富集程度,ssGSEA通过计算每个样本中基因集的富集得分来量化基因集在样本中的表达模式。
1.7 关键基因在结直肠癌与正常组织中的表达差异分析
从上海中医药大学附属普陀医院结直肠癌样本库中选取12组初发结直肠癌患者的癌组织与正常组织,使用实时定量聚合酶链反应(real-time quantitative polymerase chain reactionRT-PCR)检测关键基因在癌组织与正常组织中的表达差异。采用Trizol法提取组织中的总RNA,取500 ng RNA逆转录为cDNATakaraRR036A);使用TB greenTakaraRR420)染料按照10 μL体系进行45次循环的扩增,引物序列如表1所示,以3-磷酸甘油醛脱氢酶(glyceraldehyde-3-phosphate dehydrogenaseGAPDH)为内参,按2−∆∆Ct法分析。从人蛋白质图谱数据库(Human Protein AtlasHPA)数据库中寻找核心基因在癌组织与正常组织中的免疫组化表达差异。
图片
1.8 关键基因生存分析
基于GEPIA数据库[12]http://gepia./)进行关键基因的总生存期(overall survivalOS)的KM曲线分析,默认分组截断值为中位值。
1.9 靶向中药预测
基于Coremine Medical数据库(https://www. coremine.com/medical/)预测调控核心基因的潜在中药,筛选P0.01的中药纳入分析,搜集并整理中药的四气五味及功效主治信息进行统计和分析。
1.10 统计学方法
本研究利用R语言中的limmasurvivalDESeq2以及ggplot2包等进行数据处理、统计分析和结果可视化;利用GraphPad 9.5.1进行RT-PCR的统计分析,两组样本的数据符合正态分布且方差齐性时,组间比较使用独立样本t检验;两组样本的数据不符合正态分布或者方差不齐时,则使用非参数检验。
结果
2.1 数据预处理展示
相比于正常非炎症患者,溃疡性结肠炎炎症期患者的肠道组织中共有401个基因上调,345个基因下调(设定log2FC1P0.05),见图1。相比于溃疡性结直肠癌患者,在结直肠癌患者肠道肿瘤组织中,共有212个基因上调,600个基因下调(设定log2FC1P0.05),满足设定条件的基因展示在火山图上。
图片
2.2 差异基因筛选
2个炎癌转化阶段的差异基因中,取交集后得到共同的152个差异基因,如图2所示。在这些基因中,发现了4个在2个阶段中均被上调的基因,分别是前列腺癌易感性候选基因1prostate cancer susceptibility candidate 1PRAC1)、胰岛素样肽5 insulin-like peptide 5INSL5)、细胞表面相关黏蛋白12mucin 12MUC12)和癌胚抗原相关细胞黏附分子7carcinoembryonic antigen-related cell adhesion molecule 7CEACAM7,这4个基因亦被纳入后续筛选过程。
图片
2.3 交集差异基因富集分析
富集分析结果(图3)显示,在生物过程中,中性粒细胞趋化与迁移、白细胞趋化与迁移、粒细胞趋化与迁移显著富集,这些富集的生物过程主要涉及白细胞的迁移和化学趋性,暗示了免疫细胞可能在炎癌转化过程中发挥了中心作用;细胞成分的富集分析揭示了含胶原的细胞外基质、分泌颗粒腔、囊泡腔、细胞突起膜在炎癌转化过程中可能具有重要作用,可能与炎癌转化的细胞行为改变有关;在分子功能方面,细胞因子活性、趋化因子受体结合、多糖结合、免疫受体活性和细胞因子结合显著富集,这些分子功能的富集揭示了免疫反应和细胞信号转导在炎癌转化过程中可能发挥关键作用。KEGG路富集分析揭示了白细胞介素-17interleukin 17IL-17)信号通路、病毒与细胞因子和细胞因子受体的相互作用、类风湿性关节炎、细胞因子-细胞因子受体相互作用、趋化因子信号通路、肿瘤坏死因子(tumor necrosis factorTNF)信号通路、核因子-κBnuclear factor-κBNF-κB)信号通路等在炎癌转化过程中可能具有重要作用,这些富集的通路可能影响炎癌转化过程,为未来的研究提供潜在的疾病标志物和治疗靶点。
图片
2.4 差异基因PPI网络构建及关键hub基因筛选
通过对差异基因进行PPI网络分析,并使用CytoscapeCytoHubba插件根据网络degree值进行筛选,鉴定出了30个可能在结直肠癌炎癌转化过程中发挥重要作用的hub基因,核心基因PPI网络图见图4,图中圆圈的大小和颜色深度代表该基因在网络中的degree值,这些基因大致可分为4种类别:(1)细胞因子及其受体类基因,如蛋白质酪氨酸磷酸酶受体C型(protein tyrosine phosphatase receptor type CPTPRC)、白细胞介素1 betainterleukin 1 betaIL1B、趋化因子CXC配体8C-X-C motif chemokine ligand 8CXCL8)、CXCL1、前列腺素内过氧化物合酶2prostaglandin-endoperoxide synthase 2PTGS2)、CXC趋化因子受体 4C-X-C chemokine receptor 4CXCR4)、趋化因子受体7C-C motif chemokine receptor 7CCR7CXCR1、趋化因子配体 19C-C motif chemokine ligand 19CCL19)、CXCL2CXCL13CXCR2CXCL5CXCL3,这些基因在炎症反应和免疫调控中起关键作用,尤其是对白细胞的趋化和活化有重要影响;(2)蛋白酶及其抑制因子类基因,如基质金属蛋白酶9matrix metalloproteinase 9MMP9)、MMP1、组织金属蛋白酶抑制剂1tissue inhibitor of metalloproteinases 1TIMP1)和MMP3,它们主要参与细胞外基质的重塑,与肿瘤的侵袭性增强可能有密切关系;(3)细胞表面蛋白类基因,如整合素亚基beta 2integrin subunit beta 2ITGB2)、选择素Lselectin LSELL)、免疫球蛋白γ Fc区域受体III-Aimmunoglobulin γ Fc region receptor III-AFCGR3A)和选择素Pselectin PSELP,这些基因涉及白细胞的迁移和与肿瘤微环境的交互;(4)其他类别的基因,如普列克底物蛋白(PleckstrinPLEK)、原癌基因C-Fgrproto-oncogene C-FgrFGR)、颗粒酶Bgranzyme BGZMB)、胶原蛋白 α-1(I) 链[collagen alpha-1(I) chainCOL1A1]、中性粒细胞S100蛋白(neutrophil S100 proteinS100A12)、分泌型磷蛋白1secreted phosphoprotein 1SPP1)、纤溶酶原激活尿激酶受体(plasminogen activator urokinase receptorPLAUR)和骨髓细胞触发受体1triggering receptor expressed on myeloid cells 1TREM1,它们可能涉及到多种生物过程,包括免疫调控、细胞迁移和增殖、细胞外基质组织以及信号传导等。
2.5 机器学习算法筛选预测基因
利用机器学习算法对30个核心的hub基因进行进一步筛选,首先进行GTEx数据集和TCGA数据库的合并,去除批次效应,主成分分析(principal component analysisPCA)图见图5,共纳入453个肿瘤样本,349个正常样本,获取核心30hub基因的表达量后进行分类机器学习算法分析,利用3种机器学习算法GBMRFDT来筛选出对预测结局有意义的目标基因,3种机器学习算法筛选出的基因及交集情况见图6和表2,在这3种机器学习算法中,有8个共同的基因被筛选出来,分别是TIMP1MMP1CXCL13PLEKGZMBCXCL5CXCL3CXCL8
图片
图片
图片
2.6 神经网络模型构建预测结直肠癌发生准确度
构建的神经网络模型(图7-a)预测结局的准确度,在训练集中对正常组预测准确率为86.3%瘤组预测准确率为92.3%ROC曲线的曲线下面积(area under curveAUC)值可达0.956,见图7-b;外在验证集中正常组预测准确率为80%,肿瘤组预测准确率为80.6%ROC曲线的AUC值可达0.876ROC曲线见图7-c
图片
2.7  核心基因免疫相关性分析
通过ssGSEA分析发现8个核心基因在结直肠癌中与免疫细胞类型呈现显著的相关性,表明这些基因可能在调控肿瘤的免疫浸润中起到关键作用,并可能涉及结直肠癌的免疫调控过程。TIMP1PLEKCXCL13在多数免疫细胞类型中表现出强烈的相关性,可能在结直肠癌的炎症至癌症转化过程中起到重要的作用。这进一步提示TIMP1PLEKCXCL13在结直肠癌的免疫调控及免疫浸润调节中可能具有显著的功能。同时,MMP1GZMBCXCL8CXCL5CXCL3在部分免疫细胞类型中与结直肠癌呈现相关性,尤其在活化的CD4 T细胞、自然杀伤细胞以及先天免疫细胞中,这些基因的表达与结直肠癌的相关性尤为突出,见图8
图片
2.8  核心基因在癌组织和正常组织中的表达
RT-PCR结果显示,TIMP1MMP1GZMBCXCL3CXCL5CXCL8在肿瘤组织中表达显著升高(P0.05),CXCL13在肿瘤组织中表达显著降低(P0.05),PLEK在癌组织和正常组织中表达无显著差异,见图9HPA数据库中匹配到6个核心基因的免疫组化数据,结果显示,TIMP1GZMBCXCL5CXCL8CXCL13在肿瘤组织中的表达升高,CXCL13在正常组织中表达升高,PLEK在两组表达中无显著差异,见图10
图片
图片
2.9  核心基因生存分析
通过对TCGA数据库进行生存分析,发现在筛选出的8个核心基因中,有3个核心基因(TIMP1CXCL13CXCL8)的P0.05,具有临床意义。KM曲线生存分析图见图11KM曲线显示高表达TIMP1与结直肠癌患者的生存状况呈不良影响关联,而低表达的CXCL13CXCL8与患者的生存状况也呈不良影响关联。
图片
2.10  核心中药预测
基于筛选及验证结果,将TIMP1MMP1GZMBCXCL3CXCL5CXCL8CXCL13 7个核心基因进行中药预测,CXCL3在限定条件下未匹配到目标中药,最终基因与中药的预测网络图见图12,四气五味及功效主治统计结果见图13。结果显示预测中药以清热药和补虚药为主,四气以寒、温和平性为主,五味以苦、辛、甘味比例最大。
图片
图片
3 讨论
3.1  炎症过程及通路在结直肠癌发生发展过程扮演重要的作用
结直肠癌是全球常见的恶性肿瘤,其发病机制与炎症过程密切相关[13]。在肠道肿瘤研究中,炎症环境被认为是促进肿瘤形成和发展的重要因素,这一过程被称为“炎癌转化”,同时,肿瘤细胞可以通过多种机制逃避免疫监视,从而使肿瘤得以持续发展[14]结直肠癌的“炎癌转化”过程是一个极其复杂且微观的生物过程,本研究首先通过筛选结直肠癌炎癌转化2个阶段(正常结肠-炎性结肠,炎症结肠-结直肠癌)共同的差异基因,根据差异基因的富集分析发现炎癌转化阶段的诸多炎症通路和分子过程。
本研究的富集分析结果揭示了这一过程中可能涉及的关键生物过程、细胞成分和分子功能,以及可能发挥重要作用的KEGG通路,从而加深了对结直肠癌“炎癌转化”过程的理解。GO生物过程的富集分析结果揭示了白细胞,特别是中性粒细胞和粒细胞在“炎癌转化”过程中可能发挥了重要作用;这些细胞的趋化和迁移在这一过程中显著富集,表明免疫细胞在炎癌转化过程中扮演了中心角色,这一发现与近年来对免疫微环境在肿瘤发生发展中作用的认识一致,也为肿瘤免疫治疗策略的探索提供了新的思路。细胞成分的富集分析揭示了细胞行为,如细胞交互、分泌和细胞极性等在炎癌转化过程中的改变;在分子功能方面,细胞因子活性、趋化因子受体结合、细胞因子受体结合、受体配体活性和细胞因子结合在“炎癌转化”过程中可能发挥关键作用,这些分子功能的富集揭示了免疫反应和细胞信号转导在炎癌转化过程中可能发挥关键作用。KEGG通路富集分析结果显示,在“炎癌转化”过程中发挥关键作用的通路包括IL-17信号通路、细胞因子-细胞因子受体相互作用、趋化因子信号通路、TNF信号通路、NF-κB信号通路等,些通路可能是结直肠癌炎癌转化过程的关键调控因子,也可能是未来研究的重要靶点。
3.2 TIMP1MMP1CXCL13GZMBCXCL5CXCL3CXCL8预测结肠炎症过程的恶性转化
机器学习和神经网络模型都是目前人工智能的计算模型,用于处理和解释数据,从数据中学习和提取有用的模式,以用于预测、分类、决策等。本研究采用的3个机器学习模型RFDTGBM都可以很好地进行二分类任务,3种方法各有优略,但本质都是基于数据的计算模型,具有良好的可解释性,因此本研究将其用于筛选区分癌症与正常样本的核心基因。关于神经网络模型,一般认为隐藏层2的为深度学习网络,其利用人脑的神经元原理进行复杂的运算,相比之下,神经网络通常被视为“黑箱”,本研究利用这个“黑箱”作用,将8个核心基因作为神经网络的输入,结果作为输出,对8个核心基因预测结果的准确性进行了内部和外部2次验证,并利用常规机器学习算法的可解释性对核心基因进行进一步筛选,利用深度学习框架下的神经网络模型对核心基因的预测结果(癌症和正常样本)进行准确性的判断。
近年来,随着机器学习和神经网络模型在生物医学领域的广泛应用,为深入理解和预测炎癌转化过程提供了新的可能[15]。基于这些差异基因构建PPI网络筛选出30个核心基因,再使用机器学习算法,成功鉴定出了结直肠癌过程中的8个关键基因,这些基因与结直肠癌的炎癌转化过程密切相关,ssGSEA分析显示这些基因与诸多免疫细胞相关,对后续研究具有一定指导意义。PPI网络中富集到的30个核心基因可归类为细胞因子及其受体、蛋白酶及其抑制因子、细胞表面蛋白类,这3类基因的蛋白在肿瘤微环境中均起到非常重要的作用。
RT-PCR结合免疫组化结果显示TIMP1MMP1GZMBCXCL3CXCL5CXCL8在肿瘤组织中表达显著升高,CXCL13在肿瘤组织中表达显著降低,意味着7个基因在预测结直肠癌炎癌转化的过程中可以作为潜在的作用靶点,这些基因在其他肿瘤中的炎症过程中亦有相关研究。
TIMP1的水平在浸润肿瘤的淋巴细胞中显著增加,并与癌症进展相关[16]TIMP1在许多类型的癌症中表达增加,包括胃癌、胰腺癌、结直肠癌和乳腺癌[17-18]。一些研究发现,TIMP1的水平与胃癌的分期以及对远处器官的转移有显著的相关性[19];在胰腺癌中,TIMP1表达水平较高的患者对治疗的反应较差,且更容易发生肝转移[20]MMP1编码降解细胞外基质金属蛋白酶,现有研究表明其与头颈癌[21]、肝癌[22]、肺癌[23]等肿瘤的发生发展相关,并参与肿瘤微环境的炎症过程[24],在结直肠癌中,肿瘤相关巨噬细胞通过MMP1起到促进肿瘤发展的作用[25],还与各种结肠炎、结肠腺瘤的发生发展密切相关[26]PLEK在肿瘤中的研究较少,有研究表明其与慢性牙周炎相关[27]GZMB1种由NK细胞和T细胞产生的丝裂原,能够诱导肿瘤细胞凋亡[28]
趋化因子是一类小分子蛋白,它们可以在细胞间产生化学梯度,从而引导细胞移动。在肿瘤微环境中,趋化因子有多种作用,包括促进炎症、调节免疫应答,以及直接影响肿瘤细胞的生长和转移。趋化因子对肿瘤的作用取决于多种因素,包括特定的趋化因子类型、肿瘤类型和微环境的特性。这些因子可能对肿瘤有促进作用,也可能有抑制作用。本研究中涉及到4种趋化因子,分别为CXCL3CXCL5CXCL8CXCL13CXCL3主要由肿瘤细胞产生,对免疫细胞,特别是髓系源性抑制细胞(myeloid derived suppressor cellsMDSCs)有强烈的化学趋性作用[29]。研究发现,MDSCs的聚集与多形性胶质母细胞瘤患者的预后密切相关。这项研究还发现,CXCL3的表达与多形性胶质母细胞瘤患者的预后密切相关,可以作为多形性胶质母细胞瘤有价值的预后标记物[30]CXCL5的过度表达增强了结直肠癌细胞的迁移和侵袭能力,这可能是通过激活特定途路引发上皮间质转化(epithelial-mesenchymal transitionEMT)实现的[31]CXCL8是主要的人类中性粒细趋化因子和炎症的主要介质。有研究证明CXCL8促进巨噬细胞M2极化,增加结直肠癌微环境中的免疫浸润[32],肝癌患者血液中的CXCL8水平与肝癌微血管浸润密切相关[33]CXCL13蛋白及其受体CXCR5在炎症反应、免疫反应以及淋巴结新生中发挥了重要作用[34],目前研究显示,肿瘤环境中的CXCL13对癌细胞的增殖、迁移和侵袭产生影响[35]这些基因均涉及肿瘤的免疫微环境,且构建的神经网络模型对结直肠癌的发生预测具有较高的准确性,这对临床结直肠癌的诊疗具有重要意义,可以在患者炎症的早期阶段对患者进行指标监测,对患者炎癌转化的风险进行评估,以期对患者的可能癌变进行早期的干预。在后续炎癌转化研究中可以重点关注这些基因在结直肠癌发生发展中的作用。
TIMP1CXCL13CXCL8 3个基因展现出和总生存期的相关性,TIMP1高表达对患者是风险因素,CXCL13CXCL8高表达对患者来说是保护因素,后续可以重点研究这3个基因在炎癌转化过程中的主要机制。虽然机器学习和神经网络模型对生物靶点的预测得到了充分应用,但仍具有不足之处,二者对数据输入的质量具有严格要求,低质量的数据往往难以得到可靠的结果;神经网络模型的黑箱特性意味着其预测结果往往难以解释。
3.3  靶向预测的中药是干预结直肠癌炎癌转化过程的潜在药物
炎症在肿瘤发生发展过程中的作用目前已经得到了广泛的证实,其被列入“十大肿瘤特征”之一,有研究证实炎症在早期黏膜病变、结肠腺瘤、结肠癌过程中长期存在;在这个背景下,早期干预显得尤为重要,如果能在疾病尚处于发展初期阶段即炎症阶段,就进行积极的干预措施,那么结直肠癌的防治效果将可能显著提高。中医一直秉承“治未病”的理念,尤其强调在疾病尚处于发展的初期阶段实施积极的干预措施[36],这一理念与本研究的目标——在结直肠癌的炎症阶段进行干预是一致的。
本研究对7个验证后的核心基因进行了中药的预测,对预测的中药分析后发现,寒性和温性中药所占的比例最大;苦味、辛味、甘味中药所占比例最大,表明这些中药对关键基因的影响可能更为显著。在功能主治的分类中,清热药和补虚药所占的比例最大,这与结直肠癌患者的中医证型不谋而合,1项研究显示结直肠癌的中医证型以脾虚和湿热为主[37-38]。这可能暗示着这两类中药在调节关键基因及可能的生存影响中具有重要作用。本研究预测的清热药的代表药物有关木通、七叶一枝花、鱼腥草、黄芩、大黄等,已有研究证实部分中药在炎癌转化中发挥作用,关木通中的木通皂苷D通过激活核因子红细胞2相关因子2通路抑制炎症反应[39],七叶一枝花提取物对多种肿瘤中具有抑制作用,包括肺癌[40]、乳腺癌[41]等;鱼腥草可以抑制促癌因子并抑制炎症反应,是一种典型的抗炎中药[42];大黄在临床的应用十分广泛,对胰腺炎、胆囊炎等疾病具有显著的抗炎作用[43-44]本研究预测的补虚药的代表药物有鹿骨、人参、淫羊藿、沙苑子等,人参是补气、补脾之品,现有研究亦显示人参能够调节炎症诱导的血管形成[45],增强免疫功能。其他预测中药在炎癌转化中的机制研究较少,但可能亦对炎癌转化过程具有干预作用。
中国传统医学的治未病理论强调预防疾病的发生,这在结直肠癌的炎癌转化过程中具有极其重要的指导意义。对于结直肠癌而言,炎症状态可能是癌症发生的早期阶段,这与本研究中发现的炎癌转化过程中免疫浸润的重要作用相符。这为今后的研究提供了一个理论基础,即在免疫浸润的过程中寻找早期干预的机会,从而阻止或延缓结直肠癌的发展。通过机器学习算法和神经网络模型的应用,可以更深入地了解结直肠癌的炎癌转化过程,并找到更有效的预防和治疗方法;这不仅可以提高结直肠癌的早期诊断率,还能为结直肠癌患者提供更个性化的治疗方案。
利益冲突  所有作者均声明不存在利益冲突
参考文献(略) 
来  源:刘  洋,曹赛雅,冯月娇,王  杰,陈  腾.应用机器学习和神经网络模型识别结直肠癌“炎癌转化”过程的关键基因及防治中药预测  [J]. 中草药, 2023, 54(19):6386-6399.
图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多