分享

没做任何实验,刚接受了篇3.9分的文章,和大家分享下我是怎么做的

 井里的怪兽 2019-03-19

Construction of potential GlioblastomaMultiforme-related miRNA-mRNA regulatory network. Received: 12 September2018; Accepted: 28 February.

这篇文章发表在Frontiersin Molecular Neuroscience 

(2017-2018年影响因子3.9)

研究背景

多形性胶质母细胞瘤(GlioblastomaMultiforme, GBM)是一种高度恶性的肿瘤,在所有脑肿瘤中最具侵袭性。GBM很少发生远处转移,但其很容易侵犯周围脑组织(认为与其快速增殖有关)。目前针对GBM的治疗手段还是很有限,一般是手术联合放疗+替莫唑胺,但是绝大部分患者最后还是复发,平均生存期只有12-18月左右。开发一种有效的治疗策略能为GBM患者带去福音。微小RNA是目前炙手可热的研究领域,它在肿瘤中的强大作用也已被多方证实。但是,目前关于微小RNA在GBM中的研究还不是那么充分。因此,找到一些能在GBM发生过程中起作用的微小RNA可能能够找到一些有效的治疗靶点,从而提高患者生存期并改善预后状况。况且,众多其他领域(外泌体、自噬、免疫以及其他ncRNA)与微小RNA也都存在交叉,当前开展的这一研究能为这些领域提供部分提示。

主要研究内容

1、筛选差异miRNAs

首先,在GEO数据库中查找可分析数据集,检索词:((GBM)or (Glioblastoma Multiforme)) AND ((microRNA) or (miRNA))。然后进一步浏览筛选,找到GSE90603。随后,进行分组分析,总共分成4组,包括一个肿瘤组(A.16个GBM样品)以及三个正常组(B.GBM癌旁正常组织4例;C.非GBM患者正常脑组织3例;D.B+C,共7例)。A与B\C\D依次做差异分析(GEO2R)。最后,三个分析结果作交集(veendiagram)

2、预测调控差异miRNAs的上游转录因子

miRNA的表达受到转录因子的调控已经被证实,这里我们用FunRich软件预测了调控这些差异miRNA的上游转录因子。下图只展示前十。

3、预测差异miRNAs的下游靶基因

MiRNA发挥生物学功能主要是通过负向调控下游基因的表达,因此我们预测了差异miRNA的下游靶基因,并构建了miRNA-靶基因网络图(如下图A与C)。预测miRNA靶基因的数据库有很多,我们这里采用了一个综合性预测数据库-miRNet。这个数据库的预测结合总共收集了11个预测数据库的数据结果,所以预测的结果比较准确。另外这个数据库还具有强大的可视化分析功能。

当然仅仅这样的预测出来的靶基因结果准确性往往会受到大家的质疑。因此,在这里我利用了miRNA的负向调控靶基因的这个作用机制,并引入了TCGA数据库中GBM的mRNA数据,并对其做差异分析,得到了一些差异的mRNA。如下:

最后,我将上调(下调)的miRNA分子预测出的靶基因与下调(上调)的mRNA分子作交集分析,从而筛选出可靠的靶基因(在supplementdata中)。

4、靶基因富集分析及蛋白互作分析

接下来,常规操作,对筛选的这些靶基因做GO功能注释以及KEGG通路富集分析。能做富集分析的网站挺多,包括:DAVID,PANTHER,Gene Ontology以及Metascape等等。这里,我用的是另一个数据库-Enrichr。这个数据库我在之前的推文中有提及,它有两大优势:1)数据更新快;2)分析结果可视化呈现(下图就是数据库直接生成)。大家平时也可以多用用。

然后,富集分析还是不够,只能提示我们这些基因富集在哪些通路中,给我们后续研究提供参考。我们接着构建蛋白互作网络(STRING数据库)以及筛选枢纽基因(cytoscape-CytoHubba)这个是什么呢?。下表,分别展示上调和下调10个(根据nodedegree)。

Table3. Hubgenes in the PPI networks.【仔细研究一下】

Downregulated  candidate genes

Upregulated  candidate genes

Name

Node

Name

Node

STXBP1

8

TP53

75

MYO5A

6

TOP2A

67

NSF

6

MYC

60

ITPR1

6

EGFR

55

PPP3CB

6

VEGFA

54

PRKCE

4

PCNA

54

RAB40B

3

CD44

47

TPPP

3

AURKB

46

TRPC5

3

AURKA

45

RYR2

3

CDK2

44

5、miRNA-mRNA网络构建

在我们这个研究中,我们不同于别人,直接构建所有差异miRNA所有候选靶基因之间的网络。我们采用了上述筛选的20个枢纽基因作为网络的根(mRNA)。为了进一步验证我们之前的分析的结果准确,我们进一步用GEPIA这个数据库【这个是什么?】(优势:正常脑组织比TCGA多,分析结果更准确)来验证这20个基因在GBM中的表达情况,如下(只有TRPC5的表达不存在统计学意义,但是表达的趋势还是跟之前分析一致)

接着,我们再结合之前在miRNet中构建的miRNA-mRNA关系对,筛选出网络的叶(miRNA)。然后利用cytoscapePPT构建网络,如下:

6、预后分析进一步筛选

最后,我们还进一步地评估了网络中的20个mRNA在GBM中的预后作用。发现EGFR,PPP3CB以及MYO5A具有显著作用,如下:

Table 4. Theassociation of hub gene expression and the survival in patients with GBM.

Gene  symbol

EGFR

EGFR

EGFR

PPP3CB

PPP3CB

MYO5A

Dataset

GSE7696

GSE7696

GSE7696

GSE7696

GSE7696

GSE7696

Endpoint

Overall  

Survival

Overall  

Survival

Overall  

Survival

Overall  

Survival

Overall  

Survival

Overall  

Survival

Probe  ID

201984_s_at

201983_s_at

211607_x_at

209817_at_

202432_at

204527_at

N

70

70

70

70

70

70

Cox  

Pvalue

0.015

0.003

0.012

0.035

0.031

0.000

HR

1.20

1.23

1.80

0.46

0.50

0.33

95%  CI

1.04-1.39

1.07-1.41

1.14-2.84

0.22-0.95

0.27-0.94

0.18-0.61

Effect

Worse

Worse

Worse

Better

Better

Better

整篇文章分析大概如此,大家看完应该都明白了。不过这篇文章还是存在一些不足之处的:1)筛选差异miRNA以及差异mRNA最好使用相同的标本,可惜TCGA中没有GBM的miRNA数据,而GEO中筛选的这个数据集又只做了mRNA芯片;2)miRNA-mRNA网络中的miRNA在GBM中的预后作用没有评估,因为缺乏TCGA缺乏GBM的miRNA数据;3)我本身不是神经外科专业,拿不到相应的临床组织标本,本来筛选出的这个miRNA-mRNA网络可以进一步实验验证下,然后从中筛选几个再深入研究,整篇文章还可以再上一个档次。当然里面有些分析的小细节处理大家还是需要注意,例如:筛选差异miRNA时的分组。大家有兴趣的话可以去仔细看看文章的“Materialsand methods”部分。   

文章分析所涉及到的所有数据库以及工具的使用方法,我已经录制视频课程《零基础,零代码发表4分生信SCI》,大家可在网易云课堂购买,点击阅读全文可至课程。大家搭配推文和视频教程一起学习,可以更加快速掌握类似文章的分析流程。

生信学习需要持之以恒,大家可以到目前国内最大的生信学习社区(https:///)逛逛,尤其是神秘的SangerBox可视化生信分析软件,相信对大家玩转生信一定有益。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多