部分代码见:https://www.jianshu.com/p/3553220509d7 背景知识三阴性乳腺癌是指不表达ER、PR和Her2的乳腺癌,治疗困难,预后较差。 方法1.微芯片数据使用GSE76275数据集,包含265个样本,其中有198个TNBC,67个non_TNBC 2.确定DEGs使用GEO2R确定差异表达基因(FC≥1.5,p<0.01); 使用Morpheus对100个显著的DEGs作热图 3.GO和KEGG通路富集分析使用STRING 10.5 input DEGs并output结果,p<0.05认为具有显著性;使用DAVID 6.8作KEGG分析 4.PPI网络建立和通路间的相关性分析使用实验设置、文本挖掘、数据库、共表达、邻域、基因融合和共流框勾选建立DEGs网络;使用Cytoscape中的MCODE来screen PPI网络中的分子(显示score>3,nodes number >3的分子);使用Cytoscape中的ClueGo进行通路间富集分析(呈现p<0.05) 5.生存分析即总体生存率Kaplan-Meier估计 使用cBioPortal数据库中的METABRIC等数据进行生存分析。以GO富集分析和ClueGO构建的相互关系网络为基础,在cBioPortal中提交基因名,进行生存分析,其中Logrank检验p <0.05的基因呈现。 结果1.确定DEGs基于标准找到207个DEGs,其中56 up,151 down,见火山图。top 100的基因见热图和聚类分析 ![]() image.png ![]() image.png 2.GO和KEGG通路富集分析上图 ![]() image.png ![]() image.png ![]() image.png 3.PPI网络建立和通路间的相关性分析确定了168个nodes和108个edges ![]() image.png ![]() image.png 4.生存分析![]() image.png 参考来源:生信技能树 友情链接: 课程分享 欢迎关注公众号:青岛生信菜鸟团 |
|