共 55 篇文章 |
|
DNA序列比对/反向互补转换进行DNA序列比对的工具有很多,有本地化的,也有在线的如NCBI、Uniprot等。这些这里都不提了,大家都明白。在此,介绍两个网页版的工具:序列比对+反向互补转换。 阅1 转自连果啦啦 公众公开 23-04-13 16:26 |
wget http://www.biotrainee.com/jmzeng/igv/test.bedsed -n ''H3K4me3''wc -l *十五题、重新打开 rmDuplicate/samtools/paired 文件夹下面的后缀为BAM 的文件,再次查看第二列,并且统计 涉及的知识samtools view -H *.sorted.bamsamtools view -H *.sorted.bam|awk ''print {$2}''| grep "chr"|so... 阅1 转自健明 公众公开 23-03-27 20:28 |
1、从NCBI下载基因ID信息:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/GENE_INFO/Mammalia/Homo_sapiens.gene_info.gz.一、转refseq:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2refseq.gz.二、转ENSG:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2ensembl.gz#TCGA小工具ENSG转换由此而来。五、基因与GO的对应关系:ftp://ftp.ncbi.nlm.nih.gov/ge... 阅1 转自微笑如酒 公众公开 22-09-29 21:54 |
比对软件STAR创建索引文件(index)STAR --runMode genomeGenerate \ --runThreadN 10 \ --genomeDir ./index \ --genomeFastaFiles ./Homo_sapiens/UCSC/hg19/Sequence/WholeGenomeFasta/genome.fa \ --sjdbGTFfile ./Homo_sapiens/UCSC/hg19/Annotation/Genes/genes.gtf \ --sjdbOverhang 75 \ --limitGenomeGenerateRAM 12500000000... 阅1 转自bifx101 公众公开 22-09-07 00:35 |
###之前从sra转换来的fq文件后缀是.fastq.gz,现在用的后缀为.fq.gzmkdir /project/home/lyang/sra/GSE130398/5.mappingcd /project/home/lyang/sra/GSE130398/5.mappingln -s /project/home/lyang/sra/GSE130398/4.trim_galore/*.fq.gz /project/home/lyang/sra/GSE130398/5.mapping/# 建立结果存储路径ln *2_val_2.fq.gz *1_val_1.fq.gz /pro... 阅1 转自健明 公众公开 22-09-06 18:20 |
最重要的使用方法,当然是读入vcf文件啦,如下:library(vcfR)vcf_file=''/Users/jmzeng/germline/merge.dbsnp.vcf''vcf <- read.vcfR( vcf_file, verbose = FALSE )最基本的操作函数如下:show(object) colnames(vcf@fix)vcf@fix[1:4,1:4]colnames(vcf@gt)vcf@gt[1:4,1:4]head(x, n = 6, maxchar = 80) plot(x, y, ...) ##... 阅1 转自健明 公众公开 22-06-14 16:47 |
是一个染色质空间互作的数据库,通过该数据库可以查询与某个感兴趣的染色质区域互作的所有染色质片段信息,是一种one-to-all的查询模式,对应的文章发表在Nucleic Acids Research上,链接如下。可以看到在vs信息栏中不同样本分别用红色和蓝色表示,而Hi-C图谱中也是对应蓝色和红色,其中蓝色区域代表该区域的互作频率在蓝色样本中高,红色区域... 阅1 转自生信修炼... 公众公开 22-05-12 10:37 |
两篇推文cd ~/project/epi/mergeBam source activate chipseqls *merge.bam | while read id ;do (nohup samtools markdup -r $id $(basename $id ".bam").rmdup.bam & );done# 针对新生成的.rmdup.bam文件构建索引、统计ls *.rmdup.bam |xargs -i samtools index {} ls *.rmdup.bam | while read id ;do (nohup samtools... 阅1 转自健明 公众公开 22-05-08 16:44 |
do wget [ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP033/SRP033492/SRR1042](ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP033/SRP033492/SRR1042)$i/SRR1042$i.sra;虽然下载的SRA格式数据也是一个很流行的标准,但它只是数据压缩的标准,几乎没有软件能直接跟SRA的格式的测... 阅1 转自健明 公众公开 22-05-04 16:20 |
TCGA计划的ATAC-seq数据发布写在前面。通过对410个肿瘤样本的23种肿瘤类型(其中386个样本有技术重复)进行ATAC-seq分析,共绘制出796个染色质可及性图谱,鉴定到 562,709个调控元件,即ATAC-seq数据分析中对peaks数目统计,共有562,709个可重复、转座酶可接近的染色质可及性位点。来自相同组织的肿瘤样本经常聚在一起,如肾透明细胞癌和肾乳头... 阅1 转自健明 公众公开 22-05-03 14:56 |