从许多方面来看,回归分析都是统计学的核心。它其实是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量或结果变量)的方法。1、挑选与因变量相关的自变量 2、描述因变量与自变量之间的关系强度 3、生成模型,通过自变量来预测因变量 4、根据模型,通过因变量,来控制自变量 回归是一个令人困惑的词,因为它有许多特殊的变种。下面将对回归分析的各种变种进行一个汇总: 哈哈,这是最简单的一种线性回归,模型中只有一个Y和X。用一个量化的自变量预测一个量化的因变量。做回归之前,一般应该先做一个散点图看看,看看有无线性趋势,没有的话就不用回归啦!用一个量化的自变量预测一个量化的因变量,但是模型的关系是n阶多项式。我们常说的均匀设计方差分析,往往采用的就是多项式回归哦!Y为正态分布的连续性资料,多个X自变量,自变量可以使连续性资料、等级资料以及分类变量,但是注意哦,分类变量需要设置哑变量的。简言之,多元线性回归是用两个或多个量化的自变量预测一个量化的因变量。当研究的结局变量为分类变量时,采用的回归分析方法,具体包含3类,二元Logistic回归,等级Logistic回归以及多项Logistic回归。用一个或多个自变量预测一个类别型的因变量用一个或多个自变量预测一个代表频数的因变量,常用于小概率事件回归预测。前面说的回归,只考虑到结果,而并没有考虑结果出现的时间,而结果出现的时间肯定会反映干预措施的作用强弱。而COX回归,就是不经考虑结果而且考虑结果出现时间的回归模型。它用用一个或多个自变量预测一个事件(死亡、失败或旧病复发)发生的时间。COX回归的主要作用发现风险因素并用于探讨风险因素的强弱。对误差项相关的时间序列数据建模,对未来时间的数据进行预测。如搜集某地连续10年的月平均气温,建立时间序列分析,就可以对最近1-3年的月平均气温进行预测啦!线性回归是目前发展最为成熟的模型,所以能用线性尽量用,不能线性的想办法转化,转化不成功的,考虑非线性,它是用一个或多个量化的自变量预测一个量化的因变量,不过模型是非线性的。用一个或多个量化的自变量预测一个量化的因变量,模型的形式源自数据形式,不事先设定.用一个或多个量化的自变量预测一个量化的因变量,能抵御强影响点的干扰。主成分回归,它其实就是在进行主成分分析后,提取主成分作为自变量进行的线性回归。主成分回归是解决共线性的一种方法。对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对数线性模型中,所有用作分类的因素均为独立变量,列联表各单元格中的例数为因变量。对于列联表,卡方检验无法系统评价变量间的关系,也无法估计变量间的作用大小,而对数线性模型是处理这些问题的最佳方法。PLS是对一般最小二乘回归(ordinaryleastsquaresregression,OLS)的扩展,是集多因变量对多自变量的回归建模以及主成分分析为一体的多元数据分析方法,在一次计算之后即可同时实现预测建模以及多变量系统的综合简化。与OLS或其他建模方法相比,具有简单稳健、计算量小、预测精度高、无需剔除,任何解释变量或样本点、所构造的潜变量较确定、易于 定性解释等优点。PLS通常用于数据的“软”建模,建立因变量关于自变量的线形甚至非线形回归预测方程,特别是在自变量大于观察个数的情况下,相当有效。 Probit回归意思是“概率回归”。用于因变量为分类变量数据的统计分析,与Logistic回归近似。也存在因变量为二分、多分与有序的情况。目前最常用的为二分。医学研究中常见的半数致死剂量、半数有效浓度等剂量反应关系的统计指标,现在标准做法就是调用Pribit过程进行统计分析。
松哥:统计分析可谓初级说一说(描述性分析),中级比一比(差异性分析),高级找关系(建模型)。统计分析的复杂与美妙之处就在于模型构建。回归是构建模型的一种方法,但回归对于很多人来说都是令人困惑的,因为它有许多特殊的变种。有效的回归分析本身就是一个交互、整体的、多步骤的过程,而不仅仅是一点技巧,一起努力吧!
|