分享

GEO在线分析工具

 whwywu 2021-03-22

GEO2RGEO在线分析工具,基于此工具可以对部分GEO样品数据进行基因差异表达分析。该工具主要针对芯片数据,借助R Limma包完成分析过程,用户只需要在网业上进行简单的点击等手动操作即可获得分析结果。

以下内容,将利用案例数据GSE106876 B细胞淋巴瘤9个样本数据)进行演示。

GEO2R分析页面

通过GEO主页Tools,点击Analyze a Study with GEO2R,可进入GEO2R分析页面(网址:https://www.ncbi.nlm./geo/geo2r/),页面显示如下图A

在搜索栏中输入GEO accession 搜索需要分析的数据,注意,登录号只能是GSE登录号。以GSE106876为例,搜索结果如下图B。若对应的GSE数据不能利用GEO2R在线工具分析,网址会进行提示。

attachments-2018-06-TTpgMa0c5b2b6cf61ef9e.jpg

差异分组

搜索出所有样品之后,选择Define groups,选定差异比较分组的样品(如果是多平台数据,请先确定平台)。在Define groups下拉输入框中,先输入control,点击Enter键,确定第一个分组,同样输入第二个分组tumour,设定第二组。(注意先后顺序,对照在前,处理在后)。

选中样品之后,点击分组(control or tumour),例如案例中control选中了三个样品,tumour选中三个样品,具体见下图。

attachments-2018-06-OhF1xgOL5b2b6d2eabcc9.jpg

设定分组之后,点击Top250,可以依据网址的默认设置参数,进行差异分析,并显示分析结果的前250个(如下图)。列表结果中会显示出计算的相关数据,包括P值,logFC,以及相关的基因信息等等,而通过页面Save all results,可以针对所有的数据分析下载保存,不限于Top250

attachments-2018-06-Xm1NPju05b2b6d4336e08.jpg

点击左侧单个探针ID,可以查看到该ID对应数据变化的分布情况,如下图所示,由样本数据中该探针对应的表达量变化图片,结合logFC 值-3.68,可以看到,该探针对应的基因出现了下调(P.adjust=0.0256)。

attachments-2018-06-kdIaqsX55b2b6d4c6eaa4.jpg

数据分布

基于选中的六个样品,选择Value distribution,点击veiw,可以查看该六个样品的数据分布情况,显示结果为box 分布图(如下图)。如果需要所有样品的数据分布图,删除分组设置即可。

attachments-2018-06-hQgZLgWx5b2b6d591b644.jpg

参数修改

点击Options,可以进入差异比较的参数设置页面(如下图),可以对P值矫正方法,数据转换方法,以及相关信息显示进行修改。

attachments-2018-06-PbKOMzzX5b2b6d6360f99.jpg

其他

此外,还可以通过Profile Graph 查找单基因表达谱,以及通过R script,查看改组差异分析对应的R代码。 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多