共 18 篇文章 |
|
cufflinks的使用一. 简介。$ cufflinks [options]* 一个常用的例子:$ cufflinks -p 8 -G transcript.gtf --library-type fr-unstranded -o cufflinks_output tophat_out/accepted_hits.bam3. 普通参数。= 表示全部匹配4 Cufflinks gene id ;5 Cufflinks transcript id; 6 Fraction of major isofor m (FMI) ;7 FPKM ;8 FPKM_conf_lo; 9 FP... 阅27469 转290 评0 公众公开 15-01-25 21:37 |
阅401 转10 评0 公众公开 15-01-19 23:35 |
SAM分为两部分,注释信息(header section)和比对结果部分(alignment section),注释信息可有可无,都是以@开头,用不同的tag表示不同的信息,主要有@HD,说明符合标准的版本、对比序列的排列顺序;SEQ,序列片段的序列信息,如果不存储此类信息,此处为’*‘,注意CIGAR中M/I/S/=/X对应数字的和要等于序列长度;referencereadsegmenttempla... 阅163 转5 评0 公众公开 15-01-19 23:33 |
1 序列是一对序列中的一个2 比对结果是一个pair-end比对的末端4 没有找到位点8 这个序列是pair中的一个但是没有找到位点16 在这个比对上的位点,序列与参考序列反向互补32 这个序列在pair-end中的的mate序列与参考序列反响互补64 序列是 mate 1128 序列是 mate 2.bowtie2有时并不能完全确定一个短的序列来自与参考序列的那个位置,特别是... 阅2153 转15 评0 公众公开 15-01-19 23:29 |
读取Unique reads从贴好的bam文件中读取unique mapped reads,来进行下一步的分析。tophat贴的结果对于非unique的reads会反复出现在bam/sam中,因此不挑unique reads后续结果会不准确。直接 samtools view accepted.bam | grep ''\bNH:i:1\b'' >accepted_unique.sam或者使用 grep -w NH:i:1 accepted.sam > accepted_uni... 阅1229 转6 评0 公众公开 15-01-19 23:04 |
用FastQC检查二代测序原始数据的质量当二代测序的原始数据拿到手之后,第一步要做的就是看一看原始reads的质量。加上 -q 会进入沉默模式,即不出现下面的提示:Started analysis of target.fqApprox 5% complete for target.fqApprox 10% complete for target.fq如果输入的fastq文件名是target.fq,fastqc的输出的压缩文件将是target.fq_fastqc... 阅1027 转14 评0 公众公开 14-10-05 15:25 |
BWA is a fast light-weighted tool that aligns short sequences to a sequence database, such as the human reference genome.Whole genome alignments to a reference genome.POSIX. * Slider- An application for the Illumina Sequence Analyzer output that uses the probability files instead of the sequence files as an input for ... 阅70 转4 评0 公众公开 14-10-05 11:11 |
“检测跨处理/条件的差异表达基因是一个关键步骤,而且有时是RNA-seq数据统计分析的主要目标。差异表达基因的确定有助于我们阐明基因功能,当细胞响应不同的处理和条件时。此外,检测差异表达基因是聚类基因表达谱或检验基因集富集性的事先步骤。由于RNA-seq历史尚短并且在不断发展,目前还没有可用的标准方法基于这些数据来检测差异表达基因。... 阅3943 转22 评0 公众公开 14-08-20 17:37 |
多样的RNA-seq数据分析的可用方法概述。迄今为止,RNA-seq已经用于大量物种的各类研究,如推断可变剪接、定量基因和转录本的表达、检测基因融合、揭示lncRNAs和表达的外显子中的SNVs。参考基因组序列对于准确地进行各种RNA-seq研究是至关重要的,因为它提供了reads映射的模板。总的来说,基因组引导的方法更适合于具有高质量组装的可用参考基因... 阅2161 转39 评0 公众公开 14-08-20 17:22 |
Cuffquant and cuffnormcuffquant能够对单个 BAM 文件的基因转录本表达水平进行定量。cuffnorm能够用 cuffquan 的输出文件作为输入文件,对基因和转录组,简单计算标准化过的表达水平。当你想要的是一系列可比较的基因、转录组、CDS 组和 TSS 组的表达值时,可是使用 cuffnorm。例如,当你仅仅想对单个基因的表达值做个热图或者点图时。 阅2899 转5 评0 公众公开 14-07-03 11:09 |