【原】混合线性模型之富二代和学霸的故事

育种数据分析 2021-11-18

展开全文

富二代和学霸的故事

举个例子，在一个课堂上，小学六年级，班里面有30个学生，这些学生有一年级到五年级的学习成绩，现在根据这些数据，预测这些学生六年级的成绩。

「学生分类：」

富二代，富二代家里有钱，幼儿园和小学都有私人教师，个性化补习，起点较高。
学霸，学霸就是聪明，知识掌握容易，进步很快
普通学生，起点一般，知识掌握速度也一般

「对应模型：」

lmer混合线性模型中，随机因子的定义有「截距，intercept」和「斜率，slope」两个参数。

富二代，就是截距很高，就是起点很高学霸，就是斜率很高富二代学霸，就是截距很高，斜率也很高

1. 模型解释

lmer常用模型公式如下：

mod= lmer(data = , formula = y ~ Fixed_Factor + (Random_intercept + Random_Slope | Random_Factor))

data，为数据集
y，为观测值，所要分析的性状，因变量
Fixed_Factor，为固定因子
()内为随机因子

Random_intercept，为随机截距，即认为不同群体因变量的分布不同（通俗的解释：有的人生下来起点高，是富二代，有的人是一般群众，起点低）
Random_Slope，为随机斜率，即认为不同群体受固定因子的影响不同（通俗解释：有的人是学霸，学习能力强，2个小时学会，斜率高；有的人是学渣，2天才能学会，斜率低）
Random_Factor，随机因子

❝
参考: https://zhuanlan.zhihu.com/p/63092231
❞

2. 常用模型

2.1 Random intercept with fixeed mean

这里是截距（intercept）随机，均值（mean）固定。

公式：

(1 | g)
也可以写为：1 + （1 | g）

比如下面两种模型是等价的：

mod1a = lmer(Reaction ~ Days + (1 | Subject), data=dat)
mod1aa = lmer(Reaction ~ Days + 1 + (1 | Subject), data=dat)

2.2 Random intercept with a priori means

公式：

0 + offset(0) + (1 | g)
也可以写为：-1 + offset(0) + (1 | g)

这部分没有很理解，也没有例子，官方文档解释如下：

❝
The names of grouping factors are denoted g, g1, and g2, and covariates and a priori known offsets as x and o
❞

2.3 Intercept varying among g1 and g2 within g1

公式：

1 + (1 | g1/g2)
也可以写为：(1 | g1) + (1 | g1:g2)

2.4 Intercept varying among g1 and g2

公式：

(1 | g1) + (1|g2)
也可以写为：1 + (1 | g1) + (1|g2)

2.5 Correlated random intercept and slope

公式：

x + (x | g)
也可以写为：1 + x + (1 + x|g)

2.6 Uncorrelated random intercept and slope

公式：

x + (x || g)
也可以写为：1 + x + (1|g) + (0 + x|g)

「公式汇总：」「注意：」这里，x为数值协变量，g，g1，g2为因子协变量。

❝
参考：https://cran./web/packages/lme4/vignettes/lmer.pdf
❞

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：育种数据分析 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

育种数据分析

关注对话

TA的最新馆藏

基因型数据分析时先质控还是先填充？
Haploview软件windows安装失败
GAPIT3的farmcpu模型做GWAS，报错
plink计算TagSNP和lead SNP的方法
训练AI变工具人砸自己饭碗的第一人称叙述
批量100个性状进行gwas分析--代码分享

喜欢该文的人也喜欢更多

热门阅读换一换