背景知识先来谈谈背景知识,主要是微卫星不稳定性的概念以及其在肿瘤检测方面的临床意义。有分子生物学背景的人应该知道微卫星是DNA基因组中核苷酸的简单重复序列,又称短串联重复(SSR)。因为其长度由重复单位的拷贝数决定,具有高度多态性,因此是比较早期的遗传标记。微卫星不稳定性(microsatellite instability, MSI)就是指简单重复序列拷贝数的增加或缺失而造成的微卫星长度的改变。 微卫星除了作为遗传标记外,现在医学中中最大的作用在于作为实体瘤(尤其是结直肠癌)预后和辅助治疗方案的重要分子标志物。据文献报道,约有15%的结直肠癌患者中存在高MSI现象,这导致该部分患者的发病机制,预后以及药物敏感性均不同。在癌症免疫疗法中,PD-1单抗治疗对MSI-H的mCRC表型出高缓解率,该疗法已被FDA认定。 上手构建流程MISA--Catalog microsatellites present host genome (Optional)这一步不是必须,主要是针对探究性研究中从基因组中de novo鉴定MSI。临床上一般都有固定的检测位点,通过定制的捕获测序获得。 #在misa.pl和misa.ini存放的目录下执行:/data/Oncoseq/biosoft/MISA
构建genome的bwa index因为后续分析需要bwa比对的bam文件,所以这里先建立基因组索引。
BWA-MEM mappingbwa mem -R '@RG\tID:id\tSM:sample\tLB:lib' /data/Oncoseq/genome/bwa-hg19-numbered/hg19.num.fasta /data/Oncoseq/test-data/one-sample/CL100096014_L02_9_1.fq /data/Oncoseq/test-data/one-sample/CL100096014_L02_9_2.fq | samblaster --excludeDups --addMateTags --maxSplitCount 2 --minNonOverlap 20 | samtools view -S -b - > CL1.bam 制作目标区域的baseline文件(可视为数据库,需根据样本量进行完善)获取目标待检测MSI位点位置信息通过查询UCSC和文献中给出的MSI引物,获得目标位点的基因组坐标,以bed文件方式存储。
文件示例如下: 依据15个待检测位点制作msi_interval文件该步骤需要目标检测区域bed文件作为输入。
结果生成 制作msi_baseline文件, calculated from an MSI negative population (blood sample or MSI negative tumor)
输入文件包含全部正常样本mapping后的bam文件 script/create_baseline.sh test_baseline_bam.txt 结果生成MSI_BASELINE.txt 运行主程序,对待检样本进行分析同样以bam文件进行输入,配置好脚本指定需要输入的文件路径,即可运行主程序:
结果解释最终的结果以文件的形式展示,主要的信息文件以 每一个位点对应的结果以0或1展示,1为 Tips
|
|