分享

两个基因组合起来对样品分组后差异分析和生存分析

 健明 2024-04-16 发布于广东

有很多小伙伴表示看到了我们的永久免费的生信进阶培训(线下)通知,但是不知道如何才算是有基础生物信息学数据分析能力是可以过来的,其实很简单的,就是可以独立完成下面的推文图表 :

虽然说“心向往之”,但是大家可能会还是有疑惑,来我们这里可以学什么,除了 永久免费的生信进阶培训(线下) 提到的我整理好的ngs多组学的全套,以及单细胞的一条龙资料之外,更多的就是一起探讨文章里面的图表复现的可能性:(我们随时随地拿到一个文献就开始做数据处理)

比如我刚刚看到了新鲜出炉(2024年04月 )的单细胞文章:《An immune cell map of human lung adenocarcinoma development reveals an anti-tumoral role of the Tfh- dependent tertiary lymphoid structure》里面有一个简单的TCGA数据挖掘图表,是figure4的C,就可以成为一个学习的点:

(C) Volcano plots showing differentially expressed genes (DEGs) of TCGA patients with LUAD in stage I grouped by the expression levels of CD4 and CXCL13

就是需要去tcga数据库里面拿到肺癌数据集,然后以及数据库记录的病人临床信息取里面的stage1的子集后,根据这两个基因( CD4 and CXCL13)组合起来对病人分成高低两组后做差异分析,非常适合做一个学徒考核:

高低两组后做差异分析

大家可以选择任意自己感兴趣的基因的表达量矩阵,依旧任意的两个你比较熟知的基因去对病人划分组别后做差异分析。

思考题:多个基因如何组合去对样品分组呢

多个基因组合起来就是基因集啦,就可以在样品里面进行打分,打分的算法就五花八门了,样品有了打分这样的连续值就可以高低可以。

另外多个基因组合起来可以提取子集表达量矩阵,然后可以层次聚类或者主成分分析后,都可以把样品划分两个组别。

文末友情宣传

强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多