我们普遍对卡方检验比较熟悉,它通常用于列联表资料的分析处理,但是它的局限性是仅能研究两个分类变量之间是否相关,无法系统地评价变量间的联系以及变量之间相互作用的大小。且当列联表维度更高时,即需要同时研究更多分类变量之间的关系时,卡方检验就无法使用了。而对数线性模型分析则是处理此类问题的最优选择。
对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对数线性模型中,所有用作的分类的因素均为独立变量。SPSS中一共提供了对数线性模型的三个过程:general过程、logit过程、model selection过程。general过程是最简单的一种对数线性模型,该模型为拟合全饱和模型,即分类变量的各自效应以及其相互间效应均包含在对数线性模型中,它的一大特点就是不区分自变量和因变量,只考虑因素之间是否相关,不考虑谁因谁果。拟和饱和模型的实际频数完全等于理论频数,拟和优度卡方值等于0 。这是因为饱和模型中独立参数的个数等于列联表的单元格数,各单元格的频数无变化,自由度为0。
以二维列联表为例,假设每个格子的观察频数服从多项 (Multinomial )分布。如果将单元格频数取自然对数,则各因素对单元格频数的影响可用下面的公式来表示: