分享

参与大数据竞赛应该看什么书?

 霍振丽 2018-01-29


现在大数据竞赛,本质上就是做预测性模型,这本书基本上手把手教你怎么对现实世界中的很多很扭曲很恶心的数据集做预测性模型建模。

然后就是Python Machine Learning

这本书不仅比较全面地介绍了应用机器学习中的不少理论,而且他通过大量实例阐述如何用Python中的sklearn进行机器学习,最为精彩的部分我觉得在于他手把手教你怎么用python搭机器学习的pipeline,怎么ensemble模型(比如把逻辑回归,决策树,支撑向量机拼在一起做预测),怎么通过格点搜索调参等等。现在很多大数据机器学习竞赛,成败关键除了特征工程就是模型组合和调参,这本书正好填补了这一gap。然而这种竞赛中最难的地方而且也是成败最关键的还是特征工程,这个真的case by case了,行业知识 建模经验占了很大的一部分。。。也不是一两本书能够讲得清楚的。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多