分享

如何极其简单的使用GEO数据来做差异分析

 沙亮哥哥 2017-10-11
无论你是要看某个基因是否差异表达或者筛选某个GEO数据集的差异基因,这个方法绝对能够帮助你事半功倍首先假设你已经找到了一套数据GSE32323这套数据共包含44个样本,其中有17个配对的癌与...

无论你是要看某个基因是否差异表达或者筛选某个GEO数据集的差异基因,这个方法绝对能够帮助你事半功倍

首先假设你已经找到了一套数据GSE32323

这套数据共包含44个样本,其中有17个配对的癌与癌旁样本

我们先下载数据,如图

attachments-2017-09-ZTZSh4i859cc58dd09fc然后使用GEO芯片数据转换器提取出表达矩阵和样本信息表 (不会提看这里)如图:

attachments-2017-09-zCbj7uLc59cc5f26ed40

打开SampleInfo.xls文件编辑样本顺序和分组

attachments-2017-09-SyIbDemZ59cc5ff96c43最终修改后的样本信息表为(为什么cancer排在前面?软件默认前面比后面啊):

attachments-2017-09-IYp1xYyU59cc628df1db

然后使用DECenter(下载链接:http://gap./tool/10/)进行差异分析

打开,长这个样子

attachments-2017-10-JPfq2YOY59dd86944638

看似需填项比较多,其实无非就四步

1、选择表达矩阵

2、选择样本信息表(因为你要告诉软件怎么分组的嘛)

3、选择筛选差异的方法,如果是芯片数据当然选择limma了,如果是RNA-Seq的counts数据,选择DESeq2或者edgR也行啊

4、选择样本分组列,然后选择结果保存目录点击运行就行了

示例如下:

attachments-2017-10-099Dx4tW59dd87eae19d等提示跑完,打开结果保存的目录

attachments-2017-10-ec7WLV7q59dd881b9e38总共得到三个文件

1、cancer-vs-normal.limma.txt:这是cancer比normal的所有基因差异结果

2、cancer-vs-normal.limma_Dif.txt:这是根据咱们在软件选择的阈值筛选之后的差异结果

3、cancer-vs-normal.limma_TopExp.txt:这是提取的最差异的基因的表达谱

得到了差异结果之后,我们要对结果进行一个展示吧

先拿cancer-vs-normal.limma.txt使用火山图制作工具做个火山图,教程看这里:https://www./article/174

attachments-2017-10-NVzV2HCE59dd898c6a2d再拿cancer-vs-normal.limma_TopExp.txt使用热图绘制工具画个热图:教程看这里:https://www./article/165

attachments-2017-10-qSLDDjGn59dd8ab86a03导出图片,放到PPT中就可以向老板汇报了


  • 发表于 2017-09-28 10:48
  • 阅读 ( 167 )
  • 分类:软件工具

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多