分享

python机器学习(1)-机器学习常用算法介绍

 落日下旳余晖 2018-04-24
1、kNN

2、线性回归 y=WX+b
.线性模型:给定一个测试样本,通过加权求和该样本的特征值计算其结果并作为预测值
.例子:房价预测,样本有两维特征:1、每年的房产税(XTAX),2、房产年龄(XAGE
.线性回归属于线性模型中的一种
.最小二乘法求解参数
 被选择的参数,应该使拟合出的预测值曲线与观测值(真实值)之差的平方和最小
 该值也叫作:残差平方和(residual sum of squares,RSS) 
sklearn中调用线性回归
linreg = LinearRegression.fit(X_train,y_train)
其中 linreg.coef--W   linreg.intercept--b

2、逻辑回归(做的是分类问题,解决的是离散型分类问题)
输出的是[0,1]之间的值,即是一个概率值。

过拟合
 是指在调试一个统计模型时,使用过多参数,模型对于训练数据拟合程度过当,以至于太适应训练数据而非一般情况
 在训练数据上表现非常好,但是在测试数据或验证数据上表现很差

正则化
 控制模型复杂度,模型复杂度越高,越容易过拟合
 平衡损失好桉树与模型复杂度
   minimize.Loss(Data|Model)+complexity(Model)
   Loss--损失函数, complexity(模型复杂度)
 衡量模型复杂度
   模型学习得到的权重越大,模型复杂度越高
   L2正则化
     complexity(Model)=sum of the squares of the weights
     惩罚特别大的权重项


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多