配色: 字号:
数据挖掘概述
2020-09-30 | 阅:  转:  |  分享 
  
2020-09-30演讲人数据挖掘概述01数据挖掘的产生与发展产生产生背景数据库技术的成熟数据应用的普及数据过剩信息爆炸没有有效
的方法提取有效信息需要一种去粗存精、去伪存真的技术产生动力数据爆炸问题数据过量而知识贫乏数据库技术并行计算分布式计算发展重点
开展的工作目的的发展D从商业数据到商业信息的进化C演变过程BA发展演变过程挖掘对象的演变解决问题的演变发展目的的发展不再是单纯为了
研究,更主要的是为商业决策提供真正有价值的信息,进而获得利润发展重点开展的工作数据挖掘技术与特定商业逻辑的平滑集成问题数据
挖掘技术与特定数据存储类型的适应问题大型数据的选择与规格化问题数据挖掘系统的构架与交互式挖掘技术数据挖掘语言与系统的可
视化问题数据挖掘理论与算法研究02数据挖掘解决的问题数据挖掘解决的问题可伸缩高维性异种数据和复杂数据数据的所有权与分布非传统
的分析03数据挖掘的概念数据挖掘的概念ABC定义综合定义特点数据挖掘的概念定义1,数据挖掘为从数据库的大量数据中揭示出隐含的、先前
未知的、潜在有用的信息的非平凡过程2014定义定义2,数据挖掘就是数据库中知识的发现2015定义3,数据挖掘为发现数据中隐藏的模式
和关系的过程2016定义4,数据挖掘是从大量数据中提取或挖掘知识2017定义5,知识发现是从数据库中发现知识的全部过程,而数据挖掘
则是此全部过程中一个特定的关键一步2018定义6,数据挖掘广义的定义为在一些事实或观察数据的集合中寻找模式的决策支持的过程2019
数据挖掘的概念数据挖掘为在不同的数据源中包括结构化的数据、半结构化的数据和非结构化的数据,即既可以是数据库,也可以是文件系统,或其
他任何组织在一起的数据集合,通过一定的工具与方法寻找出有价值的知识的一类深层次的数据分析方法技术角度,数据挖掘是指从大量不完全的、
有噪声的、模糊的、随机的数据中,提取隐含在其中的、有用的信息和知识的过程0102综合定义商业角度,数据挖掘是一种新的商业信息处理技
术,主要特点是对数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性信息和知识数据挖掘本质上是
一种深层次的数据分析方法。可描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进
一步将其模型化的先进有效的方法0304数据挖掘的概念数据量巨大动态性0102特点适用性系统性030404数据挖掘与相关概念的区分数
据挖掘与相关概念的区分与传统数据分析与信息处理、知识发现与数据仓库与OLAP与人工智能、统计学LOGO数据挖掘与相关概念的区分本
质区别:数据挖掘在没有明确假设的前提下去挖掘信息、发现知识,挖掘所得到的信息应具有预先未知、有效和实用三个特征传统的数据分析方法基
于假设驱动的;数据挖掘,在一定意义上是基于发现驱动的与传统数据分析数据源不同,数据挖掘的数据源数据是海量的,数据有噪声,数据可能
是非结构化的;传统数据分析方法的数据源一般都是清洁好的、结构化的数据https://www.wps.cnLOGO数据挖掘与相关
概念的区分数据挖掘从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的
信息和知识的过程。信息处理基于查询,可以发现有用的信息。但是这种查询回答反映的是直接存放在数据库中的信息。它们不反映复杂的模式,或
隐藏在数据库中的规律。与信息处理、知识发现知识发现是用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后
隐藏的知识,称为数据库中的知识发现https://www.wps.cn数据挖掘与相关概念的区分数据仓库中的数据可以作为数据挖掘的数
据源与数据仓库010203一种融合和互补的关系数据挖掘的数据源不一定必须是数据仓库,可以是任何数据文件或格式LOGO数据挖掘与相关
概念的区分OLAP分析过程在本质上是一个演绎推理的过程,是决策支持领域的一部分01数据挖掘在本质上是一个归纳推理的过程02与OLA
P数据挖掘和OLAP具有一定的互补性03https://www.wps.cn数据挖掘与相关概念的区分数据挖掘利用了人工智能和统计分
析的进步所带来的好处。两门学科都致力于模式发现和预测01与人工智能、统计学数据挖掘不是为了替代传统的统计分析技术。相反,它是统计分
析方法学的延伸和扩展02数据挖掘就是充分利用了统计学和人工智能技术的应用程序,0305数据挖掘的分类数据挖掘的分类按数据挖掘方法的
直接性按数据分析的角度分类按挖掘的数据库分类按挖掘的规则类按采用的技术分类按挖掘知识的抽象层次分类数据挖掘的分类按挖掘知识的反映事
物之间的性质分类数据挖掘的分类按数据挖掘方法的直接性直接数据挖掘、间接数据挖掘数据挖掘的分类按数据分析的角度分类描述式数据挖掘、预
测式数据挖掘数据挖掘的分类按挖掘的数据库分类关系型、事务型、面向对象型、主动型、空间型、文本型、多媒体、异构数据库数据挖掘的分类按
挖掘的规则类关联规则、分类规则、聚类规则、趋势分析、偏差分析、模式分析、特征规则、总结规则数据挖掘的分类按采用的技术分类模糊和粗集
方法、人工神经网络、遗传算法、决策树、最近邻技术、规则归纳、可视化技术数据挖掘的分类按挖掘知识的抽象层次分类原始层次、高层次和多层
次数据挖掘的分类按挖掘知识的反映事物之间的性质分类同类共性广义知识、特征型知识、属性差别知识、关联型知识、预测型知识、离群型知识0
62017215019伍佳2017215020邓兴媛20172152017215019伍佳20172150
20邓兴媛2017215021张爱铃2017215022刘宜杭2017215037李林蔚2017215040倪豪
廷07图8图808数据挖掘的功能与方法数据挖掘的功能与方法功能方法详细功能挖掘数据数据挖掘的功能与方法AB功能建模关联分析
概念描述010203数据总结分类分析聚类分析040506功能详细功能0102功能时间序列分析偏差分析详细功能挖掘数据预测用一些变
量或数据库的若干已知字段预测其他感兴趣的变量或字段的未知的或未来的值描述找到描述数据的可理解的、能展示一些有价值信息的模式,用于
报表中指导商业策略或进行预测数据挖掘的功能与方法决策树方法模糊集方法神经网络方法方法可视化方法统计分析方法粗
糙集方法数据挖掘的功能与方法方法生物智能算法方法决策树方法模糊集方法神经网络方法可视化方法统计分析方法粗
糙集方法方法生物智能算法09数据挖掘的应用030102金融数据分析的数据挖掘科学研究中的数据挖掘市场营销的数据挖掘
数据挖掘的应用应用前景060405电信业的数据挖掘产品制造中的数据挖掘Internet应用中的数据挖掘具体应用ABCD决策
树聚类分析关联分析神经网络具体应用决策树倾向性分析具体应用聚类分析客户细分市场细分具体应用关联分析市场组合分析套装产品分析
目录设计交叉销售具体应用神经网络倾向性分析客户保留目标市场欺诈检测10数据挖掘的发展趋势数据挖掘理论与算法的研究
复杂数据类型的挖掘问题数据挖掘语言与数据挖掘的可视化数据挖掘的性能问题数据挖掘系统的架构交互式数据挖掘技术
数据挖掘的发展趋势发展趋势数据挖掘的发展趋势数据挖掘中的动态性问题数据挖掘中的不确定性问题C数据挖掘中的私有性问题B发展趋
势A数据挖掘的发展趋势网站数据挖掘WebSiteDM生物信息或基因的数据挖掘未来的热点应用领域文本挖掘Textualm
ining多媒体挖掘未来的研究热点发现语言的形式化描述研究在网络环境下的数据挖掘技术知识的维护更新研究专门用于知识发现的数据挖掘
语言,寻求类似于数据库中SQL语言一样的数据挖掘语言,使挖掘过程走向形式化和标准化特别是在因特网上建立DMKD服务器,并且与数据库
服务器配合,实现Web挖掘数据挖掘的结果——知识是具有时效性的,需要研究知识的维护更新技术,如知识的增量更新、模型的进化等0501
030402寻求数据挖掘过程中的可视化方法加强对各种非结构化数据的挖掘使知识发现的过程能够被用户理解,也便于在知识发现的过程中进行
人机交互如对文本数据、图形数据、视频图像数据、声音数据乃至综合多媒体数据的挖掘11常用数据挖掘软件常用数据挖掘软件AC针对特定功能
或产业而研发的软件19款最好用的免费数据挖掘工具(2019年5月)整合DSS/OLAP/DataMining的大型分析系统
一般分析目的用的软件包DB常用数据挖掘软件010203MicrosoftSQLServerSASEnterpri
seMinerIBMIntelligenceMiner一般分析目的用的软件包040506UnicaPRWI
BMSPSSModelerSGIMineSet常用数据挖掘软件OracleDarwinAngossKnowl
edgeSeeker一般分析目的用的软件包KDI(针对零售行业)Options&Choice(针对保险行
业)HNC(针对信用卡欺诈或坏账检测)UnicaModel1(针对营销行业)常用数据挖掘软件针对特定功能或产业而研发的软件常用数据挖掘软件整合DSS/OLAP/DataMining的大型分析系统CognossScenarioandBusinessObjects常用数据挖掘软件19款最好用的免费数据挖掘工具(2019年5月)https://blog.csdn.net/yoggieCDA/article/details/90447561感谢聆听
献花(0)
+1
(本文系职场细细品原创)