搜索

分享

QQ空间 QQ好友新浪微博微信

多元线性回归模型

印度阿三17 2020-05-08

展开全文

1、多元线性回归模型及其矩阵表示

设Y是一个可观测的随机变量，它受到p-1个非随机因素 X1、X2、X3···X(p-1)和随机因素ε的影响。
若Y与 X1、X2、X3···X(p-1)有如下线性关系：

Y = β0   β1X1  β2X2   ···  β(p-1)X(p-1) ε,

其中，β为未知参数，ε是均值为0、方差为σ²>0的不可观测随机变量，称为误差项，
并通常假定 ε∽N(0,σ²)。
该模型称为多元线性回归模型，
称Y为因变量，X为自变量。

要建立多元线性回归模型，我们首先要估计未知参数β，为此我们要进行n(n>=p)次独立观测，得到n组数据（称为样本）。
它们应满足上面代码块里那个式子。

就有了下面这张图：
在这里插入图片描述

其中ε相互独立且均服从N(0,σ²)分布。

令：
在这里插入图片描述
则有了以下的矩阵形式：

Y = Xβ ε；

其中Y称为观测向量，X称为设计矩阵，它们是由观测数据得到的，是已知的，并假定X是列满秩的。
β是待估计的未知参数向量，ε是不可观测的随机误差向量。

上式称为多元统计回归模型的矩阵形式。

2、β和σ²的估计

经过一番计算，得出β的最小二乘估计:
在这里插入图片描述

β的最大似然估计和它的最小二乘估计一样。

误差方差σ²的估计：

在这里插入图片描述

为它的一个无偏估计。

3、有关的统计推断

3.1 回归关系的统计推断

给定因变量Y与自变量X的n组观测值，利用前面的方法可以得到未知参数β和σ²的估计，从而得出线性回归方程，但所求的方程是否有意义，也就是说XY之间是否存在显著的线性关系，还需要对回归方程进行检验。

检验方法：
建立方差分析表；
线性回归关系的显著性检验；
P值检验

3.1.1 建立方差分析表

（1）离差平方和的分解
数据的总离差平方和：（反映了Y的波动大小）
在这里插入图片描述

残差平方和：（SSE越大，观测值与线性拟合值之间的偏差就越大）
在这里插入图片描述
回归平方和：（反映了线性拟合值与它们的平均值的总偏差）

经过计算，可得出：
SST= SSE SSR
因此，SSR越大，说明线性回归关系所描述的Y波动性比例就越大，即Y与X的线性关系就越显著。

3.1.2 方差分析表

在这里插入图片描述

3.2 线性回归关系的显著性检验

检验假设：在这里插入图片描述

若H0成立，则XY之间不存在线性回归关系。

构建如下检验统计量：
在这里插入图片描述
在给定显著性水平α，查F分布表得临界值Fσ(p-1,n-p)，（即F分布的上侧σ分位数）。

计算F的观测值F0,若F0<=Fσ时，则接受H0.

3.3 p值检验

对于线性回归关系显著性检验问题，
p = P(H0).
P(H0)表示在H0为真时的概率。

若p<α,拒绝H0
若p>=α,接受H0.

来些例题

在这里插入图片描述

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：印度阿三17 > 《开发》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

印度阿三17

关注对话

TA的最新馆藏

mysql中字段空格转换
Git提交信息规范
动物识别 python 人工智能实验
require.context 自动引入指定目录下的文件、组件、redux
Flask+Vue 用户登录
比较器comparable 和 comparator

喜欢该文的人也喜欢更多

热门阅读换一换