苏十安 IP属地:湖北

文章 关注 访问 贡献
 
共 53 篇文章
显示摘要每页显示  条
1、从NCBI下载基因ID信息:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/GENE_INFO/Mammalia/Homo_sapiens.gene_info.gz.一、转refseq:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2refseq.gz.二、转ENSG:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2ensembl.gz#TCGA小工具ENSG转换由此而来。五、基因与GO的对应关系:ftp://ftp.ncbi.nlm.nih.gov/ge...
比对软件STAR创建索引文件(index)STAR --runMode genomeGenerate \ --runThreadN 10 \ --genomeDir ./index \ --genomeFastaFiles ./Homo_sapiens/UCSC/hg19/Sequence/WholeGenomeFasta/genome.fa \ --sjdbGTFfile ./Homo_sapiens/UCSC/hg19/Annotation/Genes/genes.gtf \ --sjdbOverhang 75 \ --limitGenomeGenerateRAM 12500000000...
###之前从sra转换来的fq文件后缀是.fastq.gz,现在用的后缀为.fq.gzmkdir /project/home/lyang/sra/GSE130398/5.mappingcd /project/home/lyang/sra/GSE130398/5.mappingln -s /project/home/lyang/sra/GSE130398/4.trim_galore/*.fq.gz /project/home/lyang/sra/GSE130398/5.mapping/# 建立结果存储路径ln *2_val_2.fq.gz *1_val_1.fq.gz /pro...
最重要的使用方法,当然是读入vcf文件啦,如下:library(vcfR)vcf_file=''/Users/jmzeng/germline/merge.dbsnp.vcf''vcf <- read.vcfR( vcf_file, verbose = FALSE )最基本的操作函数如下:show(object) colnames(vcf@fix)vcf@fix[1:4,1:4]colnames(vcf@gt)vcf@gt[1:4,1:4]head(x, n = 6, maxchar = 80) plot(x, y, ...) ##...
是一个染色质空间互作的数据库,通过该数据库可以查询与某个感兴趣的染色质区域互作的所有染色质片段信息,是一种one-to-all的查询模式,对应的文章发表在Nucleic Acids Research上,链接如下。可以看到在vs信息栏中不同样本分别用红色和蓝色表示,而Hi-C图谱中也是对应蓝色和红色,其中蓝色区域代表该区域的互作频率在蓝色样本中高,红色区域...
两篇推文cd ~/project/epi/mergeBam source activate chipseqls *merge.bam | while read id ;do (nohup samtools markdup -r $id $(basename $id ".bam").rmdup.bam & );done# 针对新生成的.rmdup.bam文件构建索引、统计ls *.rmdup.bam |xargs -i samtools index {} ls *.rmdup.bam | while read id ;do (nohup samtools...
do wget [ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP033/SRP033492/SRR1042](ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP033/SRP033492/SRR1042)$i/SRR1042$i.sra;虽然下载的SRA格式数据也是一个很流行的标准,但它只是数据压缩的标准,几乎没有软件能直接跟SRA的格式的测...
TCGA计划的ATAC-seq数据发布写在前面。通过对410个肿瘤样本的23种肿瘤类型(其中386个样本有技术重复)进行ATAC-seq分析,共绘制出796个染色质可及性图谱,鉴定到 562,709个调控元件,即ATAC-seq数据分析中对peaks数目统计,共有562,709个可重复、转座酶可接近的染色质可及性位点。来自相同组织的肿瘤样本经常聚在一起,如肾透明细胞癌和肾乳头...
为什么需要ATAC-seq?ChIP-seq和ATAC-seq在TF或者Tn5结合区域都会形成一个双峰的reads结合模式,但在判断peak的时候,会有不同的标准。ATAC-seq+RNA-seq: 一般来说,RNA-seq会优先于ATAC-seq先测,但是差异基因富集出来的基因通路只是一种相关性。ATAC-seq data analysis: from FASTQ to peaksATAC-seq Data Standards and Processing Pipelin...
在火山图上标记基因(方法二)ggplot(mpg, aes(displ, hwy)) + geom_point(aes(color = class)) + geom_point(size = 3, shape = 1, data = best_in_class) + ggrepel::geom_label_repel( aes(label = model), data = best_in_class )这个方法与数据量大小无关。1.从原来数据中挑选了一部分,生成新数据2.用新数据作图,向原数据做的点...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2022 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部