分享

同样的过亿的测序片段为什么得到的fastq文件大小迥异

 健明 2022-12-07 发布于广东

最近看到了某个课题组的单个组学测序数据而且就一个样品,居然在2020到2022发了五篇类似的文章。大家都知道一次差异分析可以拿到成百上千个上下调基因,所以研究者就从上下调基因里面根据变化倍数排序,一个个基因独立发文章,都使用这一个数据集。真的是,物尽其用了!

好奇之下,我就去看了看这个数据集,蛮有意思的,确实是一个样品,但是有两个不同的ngs组学技术,所以有两个ID,同样的过亿的测序片段,得到的fastq文件大小迥异,大家也可以自己点进去看看:

  • https://www.ncbi.nlm./sra?linkname=bioproject_sra_all&from_uid=391554

如下所示:

fastq文件大小迥异

可以进入这两个样品看reads详情:

  • https://trace.ncbi.nlm./Traces/?view=run_browser&page_size=10&acc=SRR5753903&display=reads
  • https://trace.ncbi.nlm./Traces/?view=run_browser&page_size=10&acc=SRR5753916&display=reads

文件比较小的是miRNA测序

网页描述是:

Library:
Instrument: HiSeq X Ten
Strategy: miRNA-Seq
Source: TRANSCRIPTOMIC
Selection: PCR
Layout: SINGLE

可以看到是单端 30bp 的测序片段:

单端 30bp 的测序片段

文件比较大的是WGS

虽然网页描述是:

Library:
Instrument: HiSeq X Ten
Strategy: WGS
Source: GENOMIC
Selection: PCR
Layout: PAIRED

但是这个数据集被这个研究者发了五篇文章,文章里面都说这个是转录组测序,蛮有意思的,我现在也不知道该相信哪个了。

可以看到双端150bp的测序片段:

双端150bp的测序片段

现在是多组学时代,其实这些各个技术流程的视频教程好几年前我就全部免费共享在b站,而且我同步分享了视频配套讲义和教辅材料;

  • 学徒第1月,基础知识介绍掌握:文档链接:https:///doc/38tEycfrQg 密码:vl3q
  • 学徒第2月,RNA-seq数据分析实战训练:文档链接:https:///doc/38y7pmgzLg 密码:p6fo
  • 学徒第3月,WES数据分析实战训练:文档链接:https:///doc/1iDucLlG5g 密码:7uch
  • 学徒第4月,ChIP-seq数据分析实战训练:文档链接:https:///doc/11taEb9ZYg 密码:wk29

也为每个组学视频课程,设置了练习题,不知道大家是否有学习呢?甚至形成了专门的学徒作业系列:

基本上每个过来我这边学习一个月以上的学徒我都会让他们学习多种组学(围绕着中心法则),而且有了Linux基础和R语言能力后, 跟着我们的视频教程很容易就学会基础流程,毫无压力。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多