共 12 篇文章
显示摘要每页显示  条
clusterProfiler可以注释到194个基因,DAVID是168,DAVID报出14个富集的BP terms,而clusterProfiler报出222个,所以DAVID报出来的,clusterProfiler也有。DAVID的背景注释是5085个基因,clusterProfiler的注释是6895。DAVID能够注释到83个基因,而clusterProfiler能够注释到104个基因,DAVID富集到1个通路,而clusterProfiler富集到9个通路。
#源代码#R的Pathifier包获取疾病异常通路。z :在计算PC的时候的Z-scorescompin :因为噪声所去除的组分(通路中的基因)xm :正常样本均值xs :正常样本标准差center : PCA的中心pctaken :主成份的数目sucess :成功计算了PDS的通路logfile :LOG文件的名称(之前没有规定则为默认名字)上图中红色圈出来的就是实例样本中的正常样本,可以发...
用R包clusterProfiler得到转录组数据GO和pathway.diff_gene.entrez文件,是通过各种差异基因软件找出来的差异基因的entrez ID号列表,每一个ID号一行,几百个差异基因就几百行。BgRation:所有( bg)基因中与该Term相关的基因数与所有( bg)基因的比值。GeneRatio:差异基因中与该ID相关的基因数与整个该Term的总基因数的比值。BgRation:所...
R语言丨diRblo:中文文本分析方便工具包chinese.misc简介(附文本样例)chinese.misc(目前为0.1.3版本)的功能极其简单,主要用于对中文文本进行数据清理工作,此外还包含另外一些实用的处理和分析功能。chinese.misc的核心函数是corp_or_dtm,可直接从文件夹名/文件名/文本向量中生成文档-词语矩阵,并且自动或按使用者要求进行一些文本清理工作...
#软件工具#结合表达数据用于更详尽的功能展示的R包-GOplot :这主要由于缺少公共可利用的可视化工具,在这里我们提出一个R包-GOplot,它基于ggplot2,用于更高级的图形展示。circ <-circle_dat(EC$david, EC$genelist) # Generate the plotting object.chord <- chord_dat(circ,EC$genes,EC$process) # Generate the binary matrix.GOClu...
一个简单的R包:倾向评分匹配前后均衡性检验。很多研究者都是对每个变量进行假设检验的,定量变量采用t检验,定性变量采用卡方检验。之后有学者提出可以对多分类变量进行计算,原理是把多分类变量亚元化以后对每个哑变量当做二分类变量进行计算,这将会得到多个标准化差。#产生模拟数据,data中包涵四个变量:分组变量treat,定量变量binary,...
集识别差异甲基化和拷贝数变异于一体的R包——ChAMP.4、用奇异值分解(SVD)方法识别变异组分(包括生物学因素或者技术变异)由于ChAMP包得到的每个实验组样本单独的拷贝数区域结果,为了方便后续分析,可以使用CNTools和cghMCR将ChAMP识别到的拷贝数变异区域合并,比对到参考基因,以获得所有基因的拷贝数变异谱,执行此过程前,需要先把多个...
干货 | R语言的数据挖掘包汇总。来源|人人都是数据咖编辑|亲切的俞老师现在对 R语言感兴趣的人越来越多,很多同学都想快速的掌握 R语言,于是为你们准备了一些学习干货,助你们一臂之力!SPADE算法: cSPADE时间序列。热图 , contour: contour, filled.contour.StuQ特邀拥有九年数据挖掘实战经验的微软MVP谢佳标老师,带你系统学习R语言,老...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部