在吗？这是一份关于结构方程模型的修炼手册

汉无为 2023-09-25

展开全文

太长不看版：结构方程模型的基本步骤如下。

1. 确定研究目的和研究模型：构建一个理论模型来描述变量之间的关系。

2. 确定变量和收集数据：数据可以通过问卷调查、实验或观察等方法获取。

3. 评估测量模型：通过探索性因素分析（EFA）、确认性因素分析（CFA）确定维度并评估测量模型的好坏，如果是很成熟的量表，可以不用进行这个步骤。

4. 评估结构模型：确定结构模型，它用于检验变量之间的因果关系。

5. 进行模型拟合指标检验：使用拟合指标，如χ²拟合度检验、比较拟合指数（CFI）、标准化根均方残差（SRMR）等来评估结构方程模型的拟合优度。拟合指标接近1（>0.9）且χ²拟合度检验值/自由度的比值<3或更低，表示模型拟合效果较好。

6. 进行参数估计和解释：对模型中的参数进行估计，常用方法有最小二乘估计和最大似然估计等。

7. 进行关系验证和修正：根据实际拟合情况对模型进行修正。

8. 进行敏感性分析：通过对模型进行不同的敏感性分析，验证结果的稳定性和一致性。

以下是正文，如果您有兴趣，可以耐心读下去。

一、结构方程模型是什么？

结构方程模型（SEM）是一种统计模型，常用于探索和验证变量之间的因果关系，是研究群体心理、行为关系和作用路径最为常用的方法之一。有多常见呢？在心理学领域自不必说，可谓是其领域科研者必备技能，很多潜变量模型都是基于结构方程模型扩展或者实现的。

看看SEM在护理领域的发文情况，以PubMed为例，利用检索式(structural equation model) AND (nurs*)进行粗略检索，发现截至今日，已有3千余篇与护理有关的文献使用了结构方程模型。

而且，从pubmed提供的发文趋势来看，最近几年使用了结构方程模型的护理类文章发文量大幅上涨。

二、拆解结构方程模型

在了解结构方程模型之前，先了解几个相关的概念：

1、观测变量：指可直接观测或度量的变量,又称为显变量，比如一个具体的问卷题目。

2、潜变量：指不能直接测量，需要测量多个相关的观测变量来推测，又称为潜在变量、隐变量或因子，它可以是某个量表所测量的变量，比如自我效能；也可以是某个多维量表中的维度。

3、内生变量：指模型需要解释的变量，在模型中被看作因变量或结局变量，有内生显变量，也有内生潜变量。

4、外生变量：外生变量指能够对内生变量产生影响的变量，在模型中被看作自变量或解释变量，有外生显变量，也有外生潜变量。

明白了上述几个概念，那么结构方程模型就好理解了：结构方程模型是一般线性模型的扩展，包括测量模型和结构模型。测量模型指依据预先设计理论模型构建观测变量与各潜变量之间的联系。而结构模型本质是各潜变量之间的回归模型。

显然，我在前面详细介绍过的验证性因子分析及中介效应模型均是结构方程模型的一种特例，两者都可以根据结构方程模型的思想去求解。其中，验证性因子分析本质就是一种测量模型，中介效应模型则是一种显变量形式的结构模型。此外，路径分析、判别分析、多元方差分析以及多元回归分析等也可以说是结构方程模型的特例。

关于验证性因子分析，与中介效应，我在前面的推文中已经有吸纳关系的介绍，如果有兴趣，可以去看看，链接附在下面了：

量表评价 | 验证性因子分析全流程，建议收藏!

知网引用破万！经典方法值得一读！

完整的结构方程模型的底层是线性模型，如下：

以包含3个潜变量，6个观测变量的模型为例，将第一个公式展开，是这样的：

x1~x6表示有6个观测变量（条目）测量了外显变量（3个维度）。ε表示维度，λ表示每个条目的因子载荷。

理解起来还是比较困难的，具体的可以自行翻看教材《医学统计学》，里面有八个参数矩阵的解释。我在这里就引用学者周涛、鲁耀斌发表论文《结构方程模型及其在实证分析中的应用》中的模型图，展示下结构方程模型的具体形式。

可以看到，这是一个完整的结构方程模型，其中Rep、use、sec、pro等变量是想要研究的潜变量（可以理解为量表的几个维度），它们分别通过3个条目进行测量，构成测量模型；如果再想对Rep、use、sec、pro等维度的关系进行研究，就需要建立结构模型。

三、结构方程模型的分析步骤

一般包括模型设定、模型识别、模型估计、模型评价和模型修正。

1、模型设定就是说我们需要根据研究目的建立假设，可以是单一模型，也可以是假设多个模型（再选择最优），还可以先提出一个或几个理论模型，再结合专业知识进行修正，如此反复直至模型拟合。

2、模型识别本质是模型中每一个自由参数能否有唯一解。参数大家应该很了解，比如一个简单的线性模型，y=a+bx，x是自变量，y是因变量，则a和b就是需要估计的参数。换到SEM中，一般来说，每个观测变量（条目）都有1个误差和系数（因子载荷），每个潜变量都有误差与系数（与其他潜变量），当然具体的自由参数还是以软件结果为准。自由参数是可以自由地通过数据进行估计的参数，表示未被限制或约束的参数，与之对应的是固定参数。

3、模型估计是就使用统计方法对模型的参数进行求解，比如y=a+bx，就可以用最小二乘法求得参数a和b，此处的a为常数项（即截距），b为回归系数。不过，结构方程模型与线性模型不同，SEM追求的是尽量缩小样本的方差协方差与模型隐含的理论方差协方差之间的差异，可用最小二乘估计和最大似然估计MLE求解。

4、模型评价是指通过一系列的指标对模型的拟合度进行评价，来帮助我们判断建立的模型到底是不是我们所需要的，常用的指标我在前面已经分享过多次，下面就列出部分指标。