RNA注释这里以inDrop实验数据举例,spliced/unspliced的RNA可以通过:
~/dropEst/build/dropest -m -F -L eiEIBA -o run1 -g cellranger/refdata-cellranger-mm10-1.2.0/genes/genes.gtf -c ~/dropEst/configs/indrop_v3.xml *.bam
velocyto run -u Gene -o out -e SCG71 -m mm10_rmsk_srt.gtf -v SCG_71_tophat.filtered.sorted.bam UCSC/mm10/Annotation/Genes/genes.gtf (注意,也可以使用-V参数直接通过 DropEst 注释spliced/unspliced的reads:) ~/dropEst/dropest -V -C 6000 -m -g ucsc_mm10_exons.gtf.gz -c ~/dropEst/configs/indrop_v3.xml *.aligned.bam) 下面的例子从 velocyto.py 生成的loom文件开始,使用 pagoda2[1] 获取细胞clusters/embedding,然后估计/可视化RNA速率。 加载R包:library(velocyto.R)
数据下载下载预先计算的loom矩阵 wget http://pklab.med./velocyto/mouseBM/SCG71.loom 读取矩阵 ldat <-read.loom.matrices(url("http://pklab.med./velocyto/mouseBM/SCG71.loom")) 使用pagoda2标准化和聚类细胞使用spliced 表达矩阵作为pagoda2的输入,并查看分布。 emat <- ldat$spliced # this dataset has already been pre-filtered, but this is where one woudl do some filtering pagoda2处理 pagoda2用于生成细胞嵌入、细胞聚类以及更精确的细胞距离矩阵。您也可以使用其他工具生成这些工具,如 Seurat等。 创建pagoda2对象,调整方差: library(pagoda2) 运行基本分析步骤以生成细胞嵌入和聚类,并可视化: r$calculatePcaReduction(nPcs=100,n.odgenes=3e3,maxit=300)
r$makeKnnGraph(k=30,type='PCA',center=T,distance='cosine'); r$getKnnClusters(method=multilevel.community,type='PCA',name='multilevel') 绘制嵌入、集群标记(左)和"Xist"表达图(将男性和女性分开展示)par(mfrow=c(1,2))
速率估计准备矩阵和聚类数据:emat <- ldat$spliced; nmat <- ldat$unspliced; # disregarding spanning reads, as there are too few of them 除了聚类和 t-SNE 嵌入,从 p2 处理,我们将采取细胞距离,优于默认的R 通常会使用全转录体相关距离。 cell.dist <- as.dist(1-armaCor(t(r$reductions$PCA))) 基于最低平均表达量(至少在其中一个cluster中)筛选基因,输出生成的有效基因总数: emat <- filter.genes.by.cluster.expression(emat,cluster.label,min.max.cluster.average = 0.2)
估计RNA速率:fit.quantile <- 0.02 可视化 t-SNE 嵌入上的速率:show.velocity.on.embedding.cor(emb,rvel.cd,n=200,scale='sqrt',cell.colors=ac(cell.colors,alpha=0.5),cex=0.8,arrow.scale=3,show.grid.flow=TRUE,min.grid.cell.mass=0.5,grid.n=40,arrow.lwd=1,do.par=F,cell.border.alpha = 0.1) 特定基因可视化:gene <- "Camp" 调整视图调整kCells,这会给我们一个更理想化的图像视图,差异肉眼可见: gene <- "Camp" 文中链接pagoda2: https://github.com/hms-dbmi/pagoda2 |
|