遗传学中描述等位基因的同源关系时,会有IBD和IBS两个概念。IBD全称Identity By Descent, 又叫做血缘同源,指的是两个个体中共有的等位基因来源于共同祖先;IBS全称Identity By State, 又叫做状态同源,指的是两个个体中共有的等位基因序列相同。 为了定量描述两个个体间的同源关系,对于IBS和IBD, 提出了IBS/IBD state的概念,以IBS为例,示意如下
3号和4号样本只有1个allel相同, IBS state的值为1,而IBD state的值为0, 因为3号样本的allel来自于父亲,4号样本的allel来自于母亲,不是共同祖先。 利用IBD可以描述两个样本间的亲缘关系,采用plink计算IBD的代码如下 plink \ 输出结果如下所示 每一列的含义如下 理想状态下父子关系的两个样本,Z0, Z1, Z2对应的值分别为0,1, 0,所有位点的一个allel都继承自父本;同卵双胞胎的两个样本,则为0,0,1,所有的allel都来自共同的祖先,对于异卵双胞胎,则为0.25,0.5,0.25,示意如下 上图表示一个父亲为AB,母亲为CD的两个双胞胎的所有分型结果的可能,对应IBD三种取值的可能为0.25,0.5,0.25。 PI_HAT这个统计量的取值范围为0-1,数值越大,两个样本的亲缘关系越近,当为1时,表示的就是同卵双胞胎,或者重复样本,可以根据这个值筛选亲缘关系近的样本进行过滤。 ·end· |
|