分享

数据挖掘技术之回归分析超全总结,常见回归模型介绍及应用场景

 timtxu 2017-06-29

回归分析介绍

回归分析通常是指用一个或者多个输入X(称为自变量,解释变量或者预测变量)来预测输出Y(称为因变量,响应变量或者结果变量)的一种方法

  • 连续型变量:如人的身高,每天的运动小时数

  • 类别型变量:

    • 无序类别变量:如性别,职业

    • 有序类别变量:如运动强度(低,中,高),成绩(优,良,中,差)

简单线性回归

一个连续型的解释变量预测一个连续型的响应变量

比如:用广告投入金额去预测销售收入金额

销售收入=b+a*广告投入

简单多项式回归

一个连续型的解释变量预测一个连续型的响应变量,模型的关系是n阶多项式

比如:用广告投入金额去预测销售收入金额

销售收入=b+a1*广告投入+a2*广告投入^2

多元线性回归

两个或多个连续型的解释变量预测一个连续型的响应变量

比如:用风速和当日辐照值去预测光伏电站的发电效率PR

发电效率PR=b+a1*风速+a2*当日辐照值

多元多项式回归

两个或多个连续型的解释变量预测一个连续型的响应变量,模型的关系是n阶多项式和交叉乘积项

比如:用广告投入金额和研发投入金额去预测销售收入金额

销售收入=b+a1*广告投入+a2*研发投入+a11*广告投入^2+a22*研发投入^2+a12*广告投入*研发投入

多变量回归

一个或者多个解释变量预测多个响应变量

Logistic逻辑回归

一个或多个解释变量预测一个类别型响应变量

注:Logistic回归的解释变量可以是连续型变量,也可以是类别型变量;响应变量是类别型变量

比如:广告的点击率预估问题(二分类问题),图像识别问题(多分类问题

Poison泊松回归

一个或多个解释变量预测一个代表频数的变量

Cox比例风险回归

一个或多个解释变量预测一个事件(死亡,失败或者旧病复发)发生的时间

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多