分享

相关性网络图 | 解密转录组 代谢组的高频图

 外科黄文斌 2023-03-17 发布于广东

一、解密转录组 代谢组高频分析内容-相关性网络图

相关性网络图与通路热图并称转录组 代谢组文章分析中的两大金刚。

转录组与代谢组数据关联分析的两大思路,其一是基于KEGG通路共注释与共富集分析,其二是基于相关性分析。前面的通路热图是KEGG共注释与表达量的直观体现,那么本期我们介绍的相关性网络图,即是相关性分析在文章中的数据体现。

图片

(Yang X et al.Food Research International, 2022)

二、看懂相关性网络图

下图展示的是一个基因与代谢物的相关性网络图。图中绿色/灰色圆形的点被称为“节点”(node/vertex),常用来表示某个实体或者对象。节点也可被叫做“点”、“结点”、“端点”、“顶点”,表示的意思相同。连接节点的连线即为“边”(edge),每个边只连接两个节点,代表两个节点具有某种联系。

图片

(Zhang L et al.Plant biotechnology journal, 2016)

在转录组与代谢组相关性网络图里,节点表示代谢物,基因;边代表节点之间的相关性。相关性网络图是一张可以展示多个数据的万能图,不仅能帮助科研工作者从数据中总结发现规律,也能让读者更快地对结果及规律有一个整体的直观感受。通过调整网络图中节点的颜色,形状,大小,位置熟悉,可以展示节点的不同属性,节点的分类,节点的亲疏关系。通过调整边的颜色,粗细,虚实,可以展示节点与节点间相关性的强弱关系,及正负调控关系。如上图中,作者用绿色原点代表转录因子,灰色原点代表结构基因,红色原点代表代谢物信息。红色边代表正相关,蓝色边代表负相关。颜色粗细代表相关性的强弱。

图片

(https:///network-visualization)

三、相关性网络图为什么这么高频

1.相关性分析是关联转录与代谢数据的桥梁。

基于KEGG的基因与代谢物的关联,只能将KEGG数据库里已知的基因和代谢物相关联。但是,实际检测的数据中,有很多基因是不在kegg通路上的,比方说转录因子,调控作用的基因kegg数据库中不展示。KEGG数据库本身的更新也有局限性,通过代谢组检测到的代谢物,往往有很多在KEGG上也是没有注释的。相关性分析就弥补了KEGG的这一缺陷,可以将所有基因与所有代谢物的表达量进行相关性计算,进而去挑选出关注的代谢物和基因绘制相关性网络图。

文章描述参考:

To further investigate the regulation of LbaBBX genes in wolfberry, a correlation network was constructed combining four metabolites, 14 structural genes, and 13 LbaBBX TFs related to carotenoid biosynthesis. Only the pairs with a Pearson correlation coefficient >0.8 were included in this analysis (Figure 8). The network (visualized using Cytoscape) included 31 nodes connected by 123 edges. The pairwise correlations between genes (FPKM values) and between gene and metabolite levels revealed that 74 and 49 pairs of nodes, respectively, showed positive and negative correlations. As shown in Figure 8, all nine carotenoid biosynthesis genes exhibited positive correlations with carotenoid contents, with LbaCYP97A29 showing the highest positive correlation (Table S8). For the 13 LbaBBX TFs, the transcript changes in LbaBBX1, LbaBBX2, LbaBBX4, LbaBBX11, LbaBBX16, LbaBBX18, and LbaBBX25 showed positive correlations, while LbaBBX9, LbaBBX12, and LbaBBX13 showed negative correlations (Table S7). For relationships between levels of carotenoid biosynthesis genes and BBX TFs, the highest positive correlation was observed between LbaBBX2 and LbaPDS, followed by LbaBBX1 and LbaCRTISO, while the highest negative correlation was found between LbaBBX11 and LbaLCYE (Table S9). It is worth noting that LbaBBX1, LbaBBX2, LbaBBX11, and LbaBBX16 levels showed strong positive correlations with levels of nine carotenoid biosynthesis genes each (Table S9). These results indicated that these five LbaBBXs (LbaBBX1, LbaBBX2, LbaBBX4, LbaBBX11, and LbaBBX16) might be involved in the regulation of carotenoid biosynthesis.

图片

(Yin Y et al. International Journal of Molecular Sciences, 2022,)

2.相关性分析是筛选新基因的一个常见思路。

通过转录组 代谢组筛选新的候选基因是一个相对大的工作量。为了避免筛选的无目的性,首先需要一个抓手,可以是已知的跟研究相关的基因也可以是已知的代谢物。通过相关性分析,将已知的基因或代谢物与检出的基因进行相关性分析,筛选出与这些正对照高表达的基因,作为候选新基因。

文章描述参考:

In the constructed co-regulation network, MYB30 and lignin synthesis pathway genes were mainly assigned to cluster XII (Supplemental Data 5 cluster XII). Consistent with previous results, expression profiles data for lignin biosynthetic genes and related transcription factors showed that Os4CL3 and Os4CL5 was strongly co-expressed with OsMYB30, as well as with OsMYB55 and OsMYB110 (Figure 5A). Further investigation indicated that OsMYB55 and OsMYB110 shared a large number  of co-regulated genes with the known regulator OsMYB30 (Figure 5A). KEGG  analysis of the related genes and metabolites revealed that their molecular functions  were primarily enriched in phenylpropanoid biosynthesis, which suggested that OsMYB55 and OsMYB110 could potentially modulate the lignin pathway。

图片

(Yang C et al. Molecular Plant, 2022)

四、绘制相关性网络图需要准备的数据

绘制相关性网络图需要2个数据:

1.网络数据文件。

表格内包含四列数据,第一列与第二列为节点数据,在转录组 代谢组网络图里可以是基因与基因,基因与代谢物,代谢物与代谢物的一一对应关系。第三列与第四列为前面一一对应的相关性(皮尔逊相关性)数据和相关性的绝对值。

图片

注:利用Excel公式”ABS”求PCC的绝对值,用来代表相关性强弱。

图片

2.属性文件

node属性文件(Table文件)构成:第1列是所有节点的名称,一定要与网络文件中的名称一致。第2列是type,对不同的节点进行分类。将代谢物归为Metabolite;对基因进行分类:结构基因定为PathwayGene,转录因子定为TF。第3列是Genenum,代表与代谢物相关的基因数目。第4列是FC,代表在相关代谢物在某一时期的差异倍数。

注:属性文件内填写的越详细,后续作图时才可以根据前面的分类将不同的信息区分开来。

图片

拿到绘制相关性网络图的数据之后,下面是如何把数据展现成图片相关性网络图一般是时选择Cytocape软件进行绘图,Windows下即可操作。那么下一期,我们手把手教你绘制转录组 代谢组高频图-相关性网络图。

参考文献:

1.Yang X, Liao X, Yu L, et al. Combined metabolome and transcriptome analysis reveal the mechanism of selenate influence on the growth and quality of cabbage (Brassica oleracea var. capitata L.)[J]. Food Research International, 2022, 156: 111135.

2.Zhang L, Chen J, Zhou X, et al. Dynamic metabolic and transcriptomic profiling of methyl jasmonate‐treated hairy roots reveals synthetic characters and regulators of lignan biosynthesis in Isatis indigotica Fort[J]. Plant biotechnology journal, 2016, 14(12): 2217-2227.

3.Yang C, Shen S, Zhou S, et al. Rice metabolic regulatory network spanning the entire life cycle[J]. Molecular Plant, 2022, 15(2): 258-275.




心动不如行动



图片

客服微信:metware888

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多