1、kNN 2、线性回归 y=WX+b .线性模型:给定一个测试样本,通过加权求和该样本的特征值计算其结果并作为预测值 .例子:房价预测,样本有两维特征:1、每年的房产税(XTAX),2、房产年龄(XAGE) .线性回归属于线性模型中的一种 .最小二乘法求解参数 被选择的参数,应该使拟合出的预测值曲线与观测值(真实值)之差的平方和最小 该值也叫作:残差平方和(residual sum of squares,RSS) sklearn中调用线性回归 linreg = LinearRegression.fit(X_train,y_train) 其中 linreg.coef--W linreg.intercept--b 2、逻辑回归(做的是分类问题,解决的是离散型分类问题) 输出的是[0,1]之间的值,即是一个概率值。 过拟合 是指在调试一个统计模型时,使用过多参数,模型对于训练数据拟合程度过当,以至于太适应训练数据而非一般情况 在训练数据上表现非常好,但是在测试数据或验证数据上表现很差 正则化 控制模型复杂度,模型复杂度越高,越容易过拟合 平衡损失好桉树与模型复杂度 minimize.Loss(Data|Model)+complexity(Model) Loss--损失函数, complexity(模型复杂度) 衡量模型复杂度 模型学习得到的权重越大,模型复杂度越高 L2正则化 complexity(Model)=sum of the squares of the weights 惩罚特别大的权重项 |
|