分享

在吗?这是一份关于结构方程模型的修炼手册

 汉无为 2023-09-25
太长不看版:结构方程模型的基本步骤如下。
1. 确定研究目的和研究模型:构建一个理论模型来描述变量之间的关系。
2. 确定变量和收集数据:数据可以通过问卷调查、实验或观察等方法获取。
3. 评估测量模型:通过探索性因素分析(EFA)、确认性因素分析(CFA)确定维度并评估测量模型的好坏,如果是很成熟的量表,可以不用进行这个步骤。
4. 评估结构模型:确定结构模型,它用于检验变量之间的因果关系。
5. 进行模型拟合指标检验:使用拟合指标,如χ²拟合度检验、比较拟合指数(CFI)、标准化根均方残差(SRMR)等来评估结构方程模型的拟合优度。拟合指标接近1(>0.9)且χ²拟合度检验值/自由度的比值<3或更低,表示模型拟合效果较好。
6. 进行参数估计和解释:对模型中的参数进行估计,常用方法有最小二乘估计和最大似然估计等。
7. 进行关系验证和修正:根据实际拟合情况对模型进行修正。
8. 进行敏感性分析:通过对模型进行不同的敏感性分析,验证结果的稳定性和一致性。

以下是正文,如果您有兴趣,可以耐心读下去。

一、结构方程模型是什么?

结构方程模型(SEM)是一种统计模型,常用于探索和验证变量之间的因果关系,是研究群体心理、行为关系和作用路径最为常用的方法之一。有多常见呢?在心理学领域自不必说,可谓是其领域科研者必备技能,很多潜变量模型都是基于结构方程模型扩展或者实现的。

看看SEM在护理领域的发文情况,以PubMed为例,利用检索式(structural equation model) AND (nurs*)进行粗略检索,发现截至今日,已有3千余篇与护理有关的文献使用了结构方程模型。

图片

而且,从pubmed提供的发文趋势来看,最近几年使用了结构方程模型的护理类文章发文量大幅上涨

图片

二、拆解结构方程模型

在了解构方程模型之前,先了解几个相关的概念:

1、观测变量:指可直接观测或度量的变量,又称为显变量,比如一个具体的问卷题目。

2、潜变量:指不能直接测量,需要测量多个相关的观测变量来推测,又称为潜在变量、隐变量或因子,它可以是某个量表所测量的变量,比如自我效能;也可以是某个多维量表中的维度。

3、内生变量指模型需要解释的变量,在模型中被看作因变量或结局变量,有内生显变量,也有内生潜变量。

4、外生变量:外生变量指能够对内生变量产生影响的变量,在模型中被看作自变量或解释变量,外生显变量,也外生潜变量。

明白了上述几个概念,那么结构方程模型就好理解了:结构方程模型是一般线性模型的扩展,包括测量模型和结构模型测量模型依据预先设计理论模型构建观测变量与各潜变量之间的联系。而结构模型本质是各潜变量之间的回归模型

显然,我在前面详细介绍过的验证性因子分析及中介效应模型均是结构方程模型的一种特例,两者都可以根据结构方程模型的思想去求解。其中,验证性因子分析本质就是一种测量模型,中介效应模型则是一种显变量形式的结构模型。此外,路径分析、判别分析、多元方差分析以及多元回归分析等也可以说是结构方程模型的特例。

关于验证性因子分析,与中介效应,我在前面的推文中已经有吸纳关系的介绍,如果有兴趣,可以去看看,链接附在下面了:

量表评价 | 验证性因子分析全流程,建议收藏!

知网引用破万!经典方法值得一读!

完整的结构方程模型的底层是线性模型,如下:

图片

图片

图片

以包含3个潜变量,6个观测变量的模型为例,将第一个公式展开,是这样的:

图片

x1~x6表示有6个观测变量(条目测量了外显变量(3个维度)。ε表示维度,λ表示每个条目的因子载荷。
解起来还是比较困难的,具体的可以自行翻看教材《医学统计学》,里面有八个参数矩阵的解释。我在这里就引用学者周涛、鲁耀斌发表论文《结构方程模型及其在实证分析中的应用》中的模型图,展示下结构方程模型的具体形式。

图片

可以看到,这是一个完整的结构方程模型,其中Rep、use、sec、pro等变量是想要研究的潜变量(可以理解为量表的几个维度),它们分别通过3个条目进行测量,构成测量模型;如果再想对Rep、use、sec、pro等维度的关系进行研究,就需要建立结构模型。
三、结构方程模型的分析步骤
一般包括模型设定、模型识别、模型估计、模型评价和模型修正。
1、模型设就是说我们需要根据研究目的建立假设,可以是单一模型,也可以是假设多个模型(再选择最优),还可以先提出一个或几个理论模型,再结合专业知识进行修正,如此反复直至模型拟合。
2、模型识别本质是模型中每一个自由参数能否有唯一解参数大家应该很了解,比如一个简单的线性模型,y=a+bx,x是自变量,y是因变量,则a和b就是需要估计的参数。换到SEM中,一般来说,每个观测变量(条目)都有1个误差和系数(因子载荷),每个潜变量都有误差与系数(与其他潜变量),当然具体的自由参数还是以软件结果为准。自由参数是可以自由地通过数据进行估计的参数,表示未被限制或约束的参数,与之对应的是固定参数。
3、模型估计是就使用统计方法对模型的参数进行求解,比如y=a+bx,就可以用最小二乘法求得参数a和b,此处的a为常数项(即截距),b为回归系数。不过,结构方程模型与线性模型不同,SEM追求的是尽量缩小样本的方差协方差与模型隐含的理论方差协方差之间的差异,可用最小二乘估计和最大似然估计MLE求解。
4、模型评价是指通过一系列的指标对模型的拟合度进行评价,来帮助我们判断建立的模型到底是不是我们所需要的,常用的指标我在前面已经分享过多次,下面就列出部分指标。

图片

5、模型修正:建好模型之后,是很有可能与我们最初的假设是有些偏差的,这点可以用模型评价指标来辅助判断,如果模型拟合较差,那么就需要借助一些参数(比如模型修正指数)来适当调整模型,常用的方法有根据MI值删除一些条目,或者限制某些参数,使其称为固定参数。很关键 !

四、常见的几个问题

1、模型无法识别

模型识别是做SEM时比较头疼的问题,如果模型无法识别,比如自由度df<0,会导致软件输出的结果不完全,或者拟合很差。

图片

没有办法保证完全可以避免不识别的问题,但是应做到下面这两点:(1)数据点的数目不能少于自由参数的数目,即df>=0;(2)为模型中每个潜变量建立测量尺度,将潜变量的方差设定为1(标准化潜变量),或者将潜变量中的任何一个观测指标的因子负载设定为1。

2、拟合指标较差怎么办?

根据MI(修正指数)进行模型修正,一些软件是可以输出MI的,MI测量了当单个固定参数或约束参数被释放为自由参数时新拟合的模型所引起的卡方值的减小量。不过,修正时要注意:先解决测量模型的设定误差;1次只修正1个地方;修正过程应先增加有意义的参数,如有必要,再剔除无意义的参数。

3、样本量如何计算?

一般大于200,也可以采用经验法,比如10:1或15:1。

4、数据不符合正态怎么办?

SEM的前提是数据服从多元正态分布,但是如果是大样本,且采用的是使用Likert 等级评分的量表,根据中心极限定理,可以按照近似正态分布进行处理。


温馨提示如果您有护理科研与统计有关的疑问,欢迎加入我们的微信交流群进行交流和讨论,这是一个纯交流与分享的群。入群方式1:公众号菜单栏(交流园地);方式2:私信后台,发送任意文字即可获取群聊二维码。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多