python机器学习（1）-机器学习库scikit-learn

落日下旳余晖 2018-04-24

展开全文

kNN,k-近邻算法

需要明确的问题

1、相似性度量，如：欧氏距离等

2、紧邻点个数，通过交叉验证得到最优紧邻点个数

kNN优缺点

1、优点

① 算法简单直观、易于实现

② 不需要额外的数据、只依靠数据（样本）本身

2、缺点

① 计算量较大、分类速度慢

② 需要预先制定k值

模型选择

分类、回归、聚类、其他

训练模型

Estimator对象

从训练数据学习得到的

可以是分类算法、回归算法或者是特征提取算法

fit方法用于训练Estimator

Estimator的参数可以训练前初始化，或者之后更新

get_params（）返回之前定义的参数

score()对Estimator进行评分

回归模型：使用“决定系数”评分

分类模型：使用“准确率”评分

测试模型

model.predict(X_test)

返回测试样本的预测标签

model.score(X_test,y_test)

根据预测值和真实值计算评分

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：落日下旳余晖 > 《小象学院学习》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

落日下旳余晖

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换