分享

Excel应用大全 | 什么是CRISP-DM 模型

 hercules028 2021-07-23
一本书教会你分分钟搞定数据分析!


什么是CRISP-DM 模型呢?你听说过吗?来让小编给你解答吧!

图片

CRISP-DM模型的起源


图片

CRISP-DM(跨行业的数据挖掘标准流程,其全称为 Cross-Industry Standard Process for Data Mining)是一种被广泛应用的跨行业数据挖掘的标准流程。CRISP-DM 是由在数据挖掘领域中经验丰富的 DaimlerChrysler、SPSS 和 NCR 三家机构共同发展起来的数据挖掘方法论。

图片

CRISP-DM 模型的 6 阶段


图片
CRISP-DM 模型并不是什么全新的概念,本质上仍是数据分析领域通用的方法论:提出问题、分析问题和解决问题。CRISP-DM 模型核心亮点在于其简洁易用的特性,非常适合大规模定制和工程管理。在当今的商业数据挖掘领域,CRISP-DM 模型已经成为业内广泛认可的事实上的行业标准。
按 照 CRISP-DM 模 型, 通 常 将 数 据 挖 掘 的 整 个 过 程 划 分 为 6 个阶段:业务理解(Business Understanding)、 数 据 理 解(Data Understanding)、 数 据 准 备(Data Preparation)、模型搭建(Modeling)、模型评估(Evaluation)和模型部署(Deployment),如图 1-8 所示。

图片

图 1-8 CRISP-DM 模型的 6 个阶段

1. 业务理解

在这个阶段,首先必须从业务角度上全面了解客户的要求和最终目的,然后将这些业务理解转化为一个明确的数据挖掘问题,最后制定项目计划并设计初步方案。

2. 数据理解

收集数据是数据理解阶段的第一步,也是整个数据挖掘项目的基础。为了对数据有初步的理解,接下来需要探索数据特征,进行简单的描述统计并核验数据质量。

3. 数据准备

数据准备阶段将对原始数据进行变量选择、数据清洗、数据加工和数据整合以构建数据挖掘数据集。在整个数据挖掘项目过程中,有可能需要多次实施数据准备工作。

4. 模型搭建

对于某类数据挖掘的需求,通常有多种方法和最佳实践可供选择使用。在模型搭建阶段,应根据数据挖掘项目的需求与特点,选择使用多种技术或方式搭建模型。

5. 模型评估

全面评估备选模型的准确性、稳定性和性能等指标,从备选模型中遴选最佳模型,并回顾模型搭建的各个步骤环节,确保最佳模型与业务目标一致,除此之外还应与客户根据实际业务场景来共同决定如何使用模型的结果。

6. 模型部署

搭建模型并不是数据挖掘的终极目的,更不是数据挖掘项目的结束标识,模型只是数据挖掘项目的交付物之一。搭建模型的目的在于应用于业务实践,解决业务问题,实现业务目标,这样才能真正实现数据挖掘的商业价值,这些都是在模型部署阶段完成的。

上述 6 个阶段的顺序并非一成不变,在不同的业务场景中,在不同类型的数据挖掘项目中,6 个阶段可以有先后不同的执行顺序,某个阶段也可能被多次执行。

例如,某公司决定实施供应链优化项目,希望借助数据挖掘技术提升门店销量预测的准确性,进而实现智能补货,避免由于门店缺货而错失销售机会。首先,物流部和信息部共同组建项目团队,针对供应链优化项目的业务需求进行充分沟通,并共同确定相关业务逻辑。信息部发现此项目所需基础数据已经在公司其他项目实施过程中完成了清洗与入库。因此可以直接进入模型搭建阶段,算法工程师将使用多种不同的数据挖掘技术来搭建算法模型。

非常不幸的是,项目进入模型评估阶段后,项目团队发现销量预测的准确性无法达到业务方的要求,经过进一步的业务调研分析,项目团队决定引入更多的输入因子,以优化模型
算法,进而提升预测算法的拟合度和泛化能力。对于新增数据集需要先进行数据理解,充分了解数据的业务含义,然后依次进入数据准备和模型搭建阶段。经过再次优化的算法模型在模型评估阶段表现优异,数据挖掘项目将进入模型部署阶段。以数据挖掘提供的算法模型为核心基础,配合智能补货系统,公司将极大提升供应链运营效率。

还想要学习其他数据处理与分析的吗?快来看看应用大全吧!

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多