共 72 篇文章 |
|
mi=unique(c(rownames(nrDEG1),rownames(nrDEG1),rownames(nrDEG1)))nrDEG = nrDEG1.nrDEG$change = as.factor( ifelse( nrDEG$P.Value <0.05 &abs(nrDEG$logFC) >logFC_cutoff,rownames( nrDEG ) <- str_sub(rownames( nrDEG ), start = 1, end = 15)nrDEG$ENSEMBL <- rownames( nrDEG )gene_up = nrDEG[ nrDEG$change == ... 阅85 转1 评0 公众公开 19-02-01 19:07 |
## 挑出亚洲人群中的tnbc和非tnbc样本,这样的方法可以确定矩阵和group_list是一一对应的tnbc_asian = tnbc_exprSet[,asian_tnbc_sample]non_tnbcE_asian = non_tnbcE_exprSet[, setdiff(asian_sample,asian_tnbc_sample)]exprSet = cbind(tnbc_asian, non_tnbcE_asian)group_list = c(rep(''''''''tnbc'&... 阅2075 转27 评1 公众公开 19-02-01 19:05 |
head(nrDEG)nrDEG_Z = nrDEG[ order( nrDEG$logFC ), ]nrDEG_F = nrDEG[ order( -nrDEG$logFC ), ]choose_gene = c( rownames( nrDEG_Z )[1:100], rownames( nrDEG_F )[1:100] )nrDEG$change = as.factor( ifelse( nrDEG$P.Value <0.01 &abs(nrDEG$logFC) >logFC_cutoff,gene_down = nrDEG[ nrDEG$change == ''''... 阅155 转1 评0 公众公开 19-02-01 19:04 |
summary(sfit)ggsurvplot(sfit, conf.int = F, pval = T)</span class=''''''''mord mathit''''''''></span class=''''''''mord mathit''''''''></span class='''''... 阅156 转8 评0 公众公开 19-02-01 18:58 |
TCGA数据库生存分析的网页工具哪家强。发现这个时候的生存分析输出的图跟前面的KMPLOT工具几乎是一模一样的,这个时候我思考的结果是既然有两个数据库一致,那么我们就会认为第三者,也就是oncolnc是错的,但是为什么它会错呢?既然提到了TCGA数据源,我就必须看看cbioportal和ucsc的xena数据源了,同样的道理,下载它们,然后在R里面比较:神... 阅310 转5 评0 公众公开 19-01-05 12:43 |
芯片的表达矩阵 exprSet = exprs(sCLLex)RNA-seq表达矩阵 exprSet = assay(ariway) # assay获取表达矩阵# 对象时一锅粥都有,用@符号表示,用$符号来取,用大的包来分析大部分包从基础变量开始,变量为矩阵、数据框、列表、数组、exprSet[1:4,1:4]boxplot(log(exprSet+1)) # normalization的一种方式。apply函数族的向量化运算是基于R语言函... 阅739 转1 评0 公众公开 19-01-05 12:40 |
## 接下来我们就要取出表达数据,但是我们只要这118个tnbc样本中成对的样本,## 即,同一个tnbc病人既有正常样本,又有肿瘤样本的表达信息。nrDEG=as.data.frame(nrDEG)edgeR_DEG =nrDEG.mi=unique(c(rownames(nrDEG1),rownames(nrDEG1),rownames(nrDEG1)))nrDEG$change = as.factor( ifelse( nrDEG$P.Value logFC_cutoff,nrDEG$SYMBOL = rown... 阅87 转1 评0 公众公开 18-12-16 16:39 |
2.对矩阵1中探针ID进行基因名注释,并去除没有注释上的探针ID,得到矩阵3(只有探针ID和注释基因名);######### 导入数据后查看数据情况,行、列名,数据维度、目标数据的大致情况,比如我们想看不同分组的各个基因的表达量,那么你就要查看分组在哪一行/列,怎么分组的,基因是什么情况,只要在掌握已有数据架构的情况下,才能随心所欲的调整... 阅2877 转58 评1 公众公开 18-11-24 10:28 |
列表中可以存储若干向量、矩阵、数据框、甚至其他列表的组合。R自带数据集中,state.center 是列表,数据集中记录的是美国50个州中心的经度和纬度。这组列表由四中元素组成,向量,矩阵,数据框和标量。列表和数据框(后面讲)多了一种检索方法$符号,这个符号在后面的脚本中很常用。列表还有双中括号访问方式,二者的区别在于[[]]输出的为元素... 阅33 转0 评0 公众公开 18-10-15 14:01 |
最近的《Cell Chemical Biology》杂志发表了一篇文章,发现目前大多数药物均存在潜在的非编码RNA结合位点,这也许会带来一场新的miRNA研究革命,这些药物的疗效在不同个体结果千差万别,难道只是SNP的原因,也许就和这些miRNA有关。mirbase的主界面,miRBase序列数据库是一个提供包括已发表的miRNA 序列数据、注释、预测基因靶标等信息的全方位... 阅37 转0 评0 公众公开 18-10-09 20:36 |