大家应该都听过这么一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。 那么特征工程是什么呢? 通过总结和归纳,特征工程包括以下方面: 创造新的特征是一件十分困难的事情,需要丰富的专业知识和大量的时间。机器学习应用的本质基本上就是特征工程。 而在公司做机器学习,大部分时间不是研究各种算法、设计高大上模型,也不是各种研究深度学习的应用,或设计N层神经网络,实际上,70~80%的时间都是在跟数据、特征打交道。 在某kaggle数据科学二分类比赛,通过有效特征的抽取,auc能提升2%(auc是评价模型好坏的常见指标之一),而通过看起来高大上的模型调参优化,auc提升只能约5‰。包括在一个电商商品推荐比赛,推荐大赛第一名的组,基于特征工程,比工程师的推荐准确 度提升16%。 由此可见,特征工程在机器学习中占有相当重要的地位。 基于以上原因,近期我们上线了【特征工程与模型优化特训】课程(此课程也是 机器学习集训营预习课),在售价199.9元的课程,今天给大家申请到的优惠价是9.9元! 课程从数据采集到数据处理、到特征选择、再到模型调优,带你掌握一套完整的机器学习流程,对于不同类型的数据,不同场景下的问题,选择合适的特征工程方法和模型优化方法进行处理尤为重要。 课程还会提供两个经典的 Kaggle 比赛案例和详细的模型融合模板,带你更容易地理解机器学习,掌握比赛上分利器。 另一方面,一整期课程才9.9元,只需一顿早餐价钱,但凡能学到一点知识都不亏。 不论你是在校生,还是已经工作的算法工程师,或者是打算转行机器学习相关岗位的人,这门课都是机器学习路上的必修课程。 大家可以看下本期课程的大纲,满满的干货,非常适合大家来入门学习。 |
|