共 10 篇文章 |
|
假设分类器的输出是样本属于正类的socre(置信度),则AUC的物理意义为,任取一对(正、负)样本,正样本的score大于负样本的score的概率。(2)第二种方法:根据AUC的物理意义,我们计算正样本score大于负样本的score的概率。取N*M(N为正样本数,M为负样本数)个二元组,比较score,最后得到AUC。那么对于正样本中rank最大的样本(rank_max)... 阅179 转0 评0 公众公开 23-03-19 12:41 |
简要介绍十大机器学习算法。1. 线性回归线性回归(Linear Regression)可能是最流行的机器学习算法。K- 最近邻算法(KNN)K- 最近邻算法(K-Nearest Neighbors,KNN)非常简单。该算法根据每个数据点的特征,将每个数据点迭代地分配给 K 个组中的一个组。8. 随机森林随机森林(Random Forest)是一种非常流行的集成机器学习算法。每个圆形节点... 阅119 转0 评0 公众公开 23-03-19 10:05 |
而HLA-DMA、HLA-DMB、HLA-DPA1、HLA-DQA1、HLA-DQB1、HLA-DRA、TLR7、CCL18、CXCL10、MMP9、BLNK、IGHM、IGKV1-17、IGLC1、IGLV1-44、CXCL13、CXCL6、CXCL9、SPP1、IL10RA、SDC1、TNFRSF17和TRBC1在clusterA中的表达水平显著高于clusterB(图B)。Imm-DEGs的PPI网络包含58个相互作用对和24个基因,其中CXCL10和MMP9与10个差异表达的免疫基因密切... 阅44 转0 评0 公众公开 23-03-15 01:29 |
欢迎咨询小云,专业的云生信团队为您提供优质评估,关注云生信,科研不迷路先上点纯干货总结1. GO:关注功能基因集,基因集数量多,更新速度中等2. KEGG:关注功能基因集,基因集数量多,更新速度中等3. GSEA/ MSigDB:关注功能基因集,基因集数量多,更新速度快4. GeneCards:关注功能基因集,操作最简单,批量化操作弱5. DisGeNET:关注疾病相... 阅793 转0 评0 公众公开 23-03-15 01:08 |
第二步通过基因之间的相关系数构建分层聚类树,聚类树的不同分支代表不同的基因模块,不同颜色代表不同的模块。根据动态剪切法确定基因模块后,再次分析,依次计算每个模块的特征向量值,然后对模块进行聚类分析,将距离较近的模块合并为新的模块。这里用不同的颜色来代表那些所有的模块,其中灰色默认是无法归类于任何模块的那些基因,如果灰... 阅1113 转5 评0 公众公开 23-03-13 20:43 |
从而将上千个差异基因归为十几或者几十个基因模块。#根据基因间表达量进行聚类所得到的各模块间的相关性图MEs = moduleEigengenes(datExpr, moduleColors)$eigengenesMET = orderMEs(MEs)sizeGrWindow(7, 6) plotEigengeneNetworks(MET, ''''''''Eigengene adjacency heatmap''''''... 阅1133 转7 评0 公众公开 23-03-13 20:43 |
设定最小模块基因数量,对基因聚类结果进行剪切,得到不同的基因模块。得到不同的基因模块后,我们需要对表达模式相似的模块进行聚类。尽管计算得到了临床性状与基因模块之间的相关性,可以挑选最相关的那些模块来分析,但是模块本身仍然包含非常多的基因,还需进一步的寻找最重要的基因。逐个输出每个颜色模块的基因,并且根据与临床性状之间... 阅1604 转13 评0 公众公开 23-03-13 19:12 |
【生信基础】深入理解FPKM/TPM,只有GTF文件如何将count转为FPKM/TPM。FPKM的计算方法如下图,C为比对到基因的fragments数(count),N为比对到参考基因的总fragments数,L为该基因的有效长度。这里这里的CPM或者RPM(read counts per million) ,其实就是不考虑长度不考虑长度直接把count除总count的N后乘百万就完事了,很多公司很坑爹的因为mi... 阅756 转8 评0 公众公开 23-03-13 08:54 |
基因名的三十六变——基因ID转换小工具汇总。3种云工具任你挑选,分别为【基因id转换为基因name】、【基因id转换】、【同源基因转换】。具体功能与使用方法如下,快来体验吧1云工具【基因id转换为基因name】2云工具【基因id转换】该小工具使用R包org.*.eg.db(Version:3.14.0),实现常见物种的基因id转换,输入待转换的基因id类型(Ensemblgen... 阅2248 转0 评0 公众公开 23-03-08 07:52 |
GEO数据到底需不需要标准化,看这里。是不是所有的GEO数据都需要标准化,芯片数据标准化的方法有哪些?数据标准化数据四分位数标准化,均值标准化,log2标准化和TMM标准化。哪些GEO数据不需要进行数据标准化?答:GEO数据库有些数据是进行标准化的数据,比如说Series Matrix File(s)格式的文件和MINiML formmatted family file就是标准化之后的... 阅161 转1 评0 公众公开 23-03-04 20:32 |