分享

数据仓库与数据挖掘应用教程/21世纪高等学校电子商务专业规划教材

 读书人心系天下 2021-09-05
  • 内容简介:

  •   本书以SQL Server分析服务为环境介绍数据仓库和数据挖掘应用技术,包括数据仓库和数据挖掘概述、OLAP和多维数据模型、数据仓库设计和SQL Server数据仓库开发实例、关联分析算法、决策树分类算法、贝叶斯分类算法、神经网络算法、回归分析算法、时间序列分析和聚类算法。

      本书内容翔实,循序渐进地介绍各个知识点,并提供全面而丰富的教学资源,可作为各类高等院校计算机及相关专业“数据仓库和数据挖掘应用技术”和“SQL Server高级应用”课程的教学用书,也适合计算机应用人员和计算机爱好者参考。

  • 目录:

  • 第1章数据仓库和数据挖掘概述

    1.1数据仓库概述

    1.1.1数据仓库的定义

    1.1.2数据仓库与操作型数据库的关系

    1.1.3数据仓库的应用

    1.2数据仓库系统及开发工具

    1.2.1数据仓库系统的组成

    1.2.2数据仓库系统开发工具

    1.3商业智能和数据仓库

    1.3.1什么是商业智能

    1.3.2商业智能和数据仓库的关系

    1.4数据挖掘概述

    1.4.1数据挖掘的定义

    1.4.2数据挖掘的主要任务

    1.4.3数据挖掘的对象

    1.4.4数据挖掘的知识表示

    1.4.5数据挖掘与数据仓库及OLAP的关系

    1.4.6数据挖掘的应用

    1.5数据挖掘过程

    1.5.1数据挖掘步骤

    1.5.2数据清理

    1.5.3数据集成

    1.5.4数据变换

    1.5.5数据归约

    1.5.6离散化和概念分层生成

    1.5.7数据挖掘的算法

    练习题

    第2章OLAP和多维数据模型

    2.1OLAP概述

    2.1.1什么是OLAP

    2.1.2OLAP和OLTP的区别

    2.1.3数据仓库与OLAP的关系

    2.2多维数据模型

    2.2.1多维数据模型的相关概念

    2.2.2OLAP的基本分析操作

    2.2.3多维数据模型的实现途径

    2.3数据仓库的维度建模

    2.3.1数据仓库建模概述

    2.3.2星形模型

    2.3.3雪花模型

    2.3.4事实星座模型

    练习题

    第3章数据仓库设计

    3.1数据仓库设计概述

    3.1.1数据仓库设计原则

    3.1.2建立数据仓库系统的两种模式

    3.1.3数据仓库设计过程

    3.2数据仓库规划与需求分析

    3.2.1数据仓库规划

    3.2.2数据仓库需求分析

    3.3数据仓库建模

    3.3.1数据仓库建模的主要工作

    3.3.2维表设计

    3.3.3事实表设计

    3.4数据仓库物理模型设计

    3.4.1确定数据的存储结构

    3.4.2确定索引策略

    3.4.3确定存储分配

    3.5数据仓库部署与维护

    3.5.1数据仓库的部署

    3.5.2数据仓库的维护

    练习题

    第4章SQLServer数据仓库开发实例

    4.1OnRetDW系统需求分析

    4.1.1OnRetDW系统的主题

    4.1.2OnRetDW系统的功能

    4.2OnRetDW的建模

    4.2.1维表设计

    4.2.2事实表设计

    4.3数据抽取工具设计

    4.4基于SQL Server 2012设计OnRetDW

    4.4.1创建数据仓库OnRetDW项目

    4.4.2创建数据源

    4.4.3创建数据源视图

    4.4.4创建维表

    4.4.5创建多维数据集

    4.4.6部署SDWS

    4.4.7浏览已部署的多维数据集

    4.5MDX简介*

    4.5.1MDX语言概述

    4.5.2执行MDX查询

    4.5.3多维数据查询

    练习题

    上机实验题

    第5章关联分析算法

    5.1关联分析概述

    5.1.1什么是关联分析

    5.1.2事务数据库

    5.1.3关联规则及其度量

    5.1.4频繁项集

    5.1.5挖掘关联规则的基本过程

    5.2Apriori算法

    5.2.1Apriori性质

    5.2.2Apriori算法求频繁项集

    5.2.3由频繁项集产生强关联规则

    5.3SQL Server挖掘关联规则

    5.3.1创建DMK数据库

    5.3.2建立关联挖掘项目

    5.3.3部署关联挖掘项目并浏览结果

    5.4电子商务数据的关联规则挖掘

    5.4.1创建OnRetDMK数据库

    5.4.2数据加载功能设计

    5.4.3建立关联挖掘项目

    5.4.4部署关联挖掘项目并浏览结果

    练习题

    上机实验题

    第6章决策树分类算法

    6.1分类过程

    6.1.1分类概述

    6.1.2分类过程的学习阶段

    6.1.3分类过程的分类阶段

    6.2决策树分类

    6.2.1决策树

    6.2.2建立决策树的ID3算法

    6.3SQL Server决策树分类

    6.3.1建立数据表

    6.3.2建立决策树分类挖掘模型

    6.3.3浏览决策树模型和分类预测

    6.4电子商务数据的决策树分类

    6.4.1创建OnRetDMK.DST数据表

    6.4.2数据加载功能设计

    6.4.3建立决策树分类模型

    6.4.4浏览决策树

    练习题

    上机实验题

    第7章贝叶斯分类算法

    7.1贝叶斯分类概述

    7.1.1贝叶斯定理

    7.1.2贝叶斯信念网络

    7.2朴素贝叶斯分类

    7.2.1朴素贝叶斯分类原理

    7.2.2朴素贝叶斯分类算法

    7.3SQL Server朴素贝叶斯分类

    7.3.1建立朴素贝叶斯分类挖掘模型

    7.3.2浏览朴素贝叶斯分类模型和分类预测

    7.4电子商务数据的贝叶斯分类

    7.4.1建立朴素贝叶斯分类挖掘模型

    7.4.2浏览挖掘结果及分析

    练习题

    上机实验题

    第8章神经网络算法

    8.1人工神经网络概述

    8.1.1人工神经元

    8.1.2人工神经网络

    8.1.3神经网络应用

    8.2用于分类的前馈神经网络

    8.2.1前馈神经网络的学习过程

    8.2.2前馈神经网络用于分类的算法

    8.3SQL Server神经网络分类

    8.3.1建立神经网络分类挖掘模型

    8.3.2浏览神经网络分类模型和分类预测

    8.4电子商务数据的神经网络分类

    8.4.1建立神经网络分类挖掘模型

    8.4.2浏览挖掘结果及分析

    练习题

    上机实验题

    第9章回归分析算法

    9.1回归分析概述

    9.2线性回归分析

    9.2.1一元线性回归分析

    9.2.2多元线性回归分析

    9.2.3SQL Server线性回归分析

    9.3非线性回归分析

    9.3.1非线性回归分析的处理方法

    9.3.2可转换成线性回归的非线性回归

    9.3.3不可变换成线性回归的非线性回归分析*

    9.4逻辑回归分析

    9.4.1逻辑回归原理

    9.4.2逻辑回归模型

    9.4.3SQL Server逻辑回归分析

    9.5电子商务数据的逻辑回归分析

    9.5.1建立逻辑回归挖掘模型

    9.5.2浏览挖掘结果及分析

    练习题

    上机实验题

    第10章时间序列分析

    10.1时间序列分析概述

    10.1.1什么是时间序列和时间序列分析

    10.1.2时间序列的分类和平稳性判断

    10.1.3时间序列建模的两种基本假设

    10.1.4回归分析与时间序列分析

    10.2确定性时间序列分析

    10.2.1移动平均模型

    10.2.2指数平滑模型

    10.3随机时间序列模型*

    10.3.1随机时间序列模型概述

    10.3.2自回归模型AR(p)

    10.4SQL Server时间序列分析

    10.4.1建立数据表

    10.4.2建立时间序列分析模型

    10.4.3浏览时间序列分析模型

    10.5电子商务数据的时间序列分析

    10.5.1创建OnRetDMK.TS数据表

    10.5.2数据加载功能设计

    10.5.3建立时间序列分析模型

    10.5.4浏览时间序列分析模型

    练习题

    上机实验题

    第11章聚类算法

    11.1聚类概述

    11.1.1什么是聚类

    11.1.2相似性度量

    11.1.3聚类过程

    11.1.4常见的聚类算法

    11.1.5聚类分析的应用

    11.2k均值算法及其应用

    11.2.1k均值算法

    11.2.2SQL Server的k均值算法应用

    11.3EM算法及其应用

    11.3.1EM算法

    11.3.2SQL Server中EM算法

    11.4电子商务数据的聚类分析

    11.4.1建立聚类挖掘模型

    11.4.2两种算法结果的比较

    11.5Microsoft顺序分析和聚类分析算法*

    11.5.1Microsoft顺序分析和聚类分析算法概述

    11.5.2Microsoft顺序分析和聚类分析算法的应用

    练习题

    上机实验题

    附录A部分练习题参考答案

    第1章

    第2章

    第3章

    第4章

    第5章

    第6章

    第7章

    第8章

    第9章

    第10章

    第11章

    附录B上机实验题参考答案

    第4章

    第5章

    第6章

    第7章

    第8章

    第9章

    第10章

    第11章

    附录C书中数据库和包含的数据表

    1. OnRet数据库

    2. SDW数据库

    3. OnRetDMK数据库

    4. DMK数据库

    参考文献

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多