分享

深度拆解特征工程经典案例,掌握比赛上分利器

 520jefferson 2020-09-18

大家应该都听过这么一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

那么特征工程是什么呢?

特征工程(Feature Engineering)对特征进行进一步分析,并对数据进行处理。常见的特征工程包括:异常值处理、缺失值处理、数据分桶、特征处理、特征构造、特征筛选及降维等。

通过总结和归纳,特征工程包括以下方面:

(点击图片查看大图)

创造新的特征是一件十分困难的事情,需要丰富的专业知识和大量的时间。机器学习应用的本质基本上就是特征工程。

而在公司做机器学习,大部分时间不是研究各种算法、设计高大上模型,也不是各种研究深度学习的应用,或设计N层神经网络,实际上,70~80%的时间都是在跟数据、特征打交道。

在某kaggle数据科学二分类比赛,通过有效特征的抽取,auc能提升2%(auc是评价模型好坏的常见指标之一),而通过看起来高大上的模型调参优化,auc提升只能约5‰。包括在一个电商商品推荐比赛,推荐大赛第一名的组,基于特征工程,比工程师的推荐准确 度提升16%。

由此可见,特征工程在机器学习中占有相当重要的地位

基于以上原因,近期我们上线了特征工程与模型优化特训】课程(此课程也是 机器学习集训营预习课)在售价199.9元的课程,今天给大家申请到的优惠价是9.9元

课程从数据采集到数据处理、到特征选择、再到模型调优,带你掌握一套完整的机器学习流程,对于不同类型的数据,不同场景下的问题,选择合适的特征工程方法和模型优化方法进行处理尤为重要。

课程还会提供两个经典的 Kaggle 比赛案例和详细的模型融合模板,带你更容易地理解机器学习,掌握比赛上分利器。

另一方面,一整期课程才9.9元,只需一顿早餐价钱,但凡能学到一点知识都不亏。

不论你是在校生,还是已经工作的算法工程师,或者是打算转行机器学习相关岗位的人,这门课都是机器学习路上的必修课程。

大家可以看下本期课程的大纲,满满的干货,非常适合大家来入门学习。




    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多