CRISP-DM流程本来是专门为数据挖掘设计的,但它非常灵活和全面,完全可以应用于任何项目分析,无论是预测性分析、数据科学还是机器学习项目。不要被长长的任务列表吓倒,因为你可以在流程实施过程中根据自己的判断对流程进行调整以适应实际情况。 流程分以下6个阶段:
如果想查看包括所有任务和子任务的完整流程说明,请参考SPSS的文章“CRISP-DM 1.0, step-by-step data mining guide”(https:///crisp-dm.pdf)。 针对其中的建模环节,本文绘制了一个机器学习算法选择的流程图,它不但可以帮助你选择合适的建模技术,而且可以帮助你更加深入地思考问题,你也可以用它和项目团队或项目负责人一起做出问题的框架。图1-1启动了一个算法流程,通过这个流程你可以选择可能使用的建模技术。你只需回答问题,它会指引你进入图1-2~图1-5。 |
|