转载自http://shzxqdj.blog.163.com/blog/static/81670577200912105410205/ 蜗牛:接触数据挖掘的概念已经近三年,但是一直都在不停的“看书”,鲜有真真正正实践的机会,对此一直“耿耿于怀”,希望今年能够有真正的机会; 能够从海量的数据中挖掘出闪光的信息和知识,并运用到第一线的运营中去,这也是我喜欢这个领域原因,也是兴趣所在,这一点可能和博主有相似的地方; 一段时间一直在从事互联网方面的所谓数据分析,用户行为分析一类的工作,也算有了一点点自己的想法,但是这些和真正的数据挖掘相差甚远,郁闷得不轻,呵呵; 在这里,我想向您请教几个困惑我很久的问题,那就是: 1)数据挖掘当然要结合业务实际,但是,更多的是偏开发还是偏应用?我的观点是,现在已经有很多比较成型的算法很好的封装到了各种工具中了,我们所要做的就是怎样更好的利用这些工具,得出我们的结果; 可是,也许是因为我本人是技术出身,加上市场上买的书籍,绝大多数都是研究算法的,招聘的企业也都是要开发人员,所以我会很自然地认为,做数据挖掘就是去做开发,去开发spss、sas、sql server analysis......而这些又往往跟企业的实际运营差的比较远, 2)接上一个问题,如果开发人员多了,工具自然就好用,那么随着工具的日渐完善,会不会出现全民皆“分析师”的情况,也就像工具都自动化了,傻瓜化了,分析师就没有存在的价值了呢? 呵呵,不要笑我问题太幼稚啊; 最后恳请博主,推荐一两本好书,以供学习,谢谢! 我的交流回复:今天是2009年新年的大年初八,还在休假中的我很高兴收到关于数据挖掘交流讨论的新年第一个话题,谢谢你的问题,首先推荐两本我觉得非常有价值的关于数据挖掘在企业的实践应用方面的专业书籍,一本是本博客多次提到的罗茂初先生的《数据库营销》,里面有几个关于具体营销应用的案例,比较浅显明白,并且作者根据自己在美国十多年项目经验从项目实践的角度对于挖掘项目中遇到的主要问题都作了不错的归纳和解释;另外一本是Michael J.A.Berry著作的《Data Mining Techniques》,这本书把当前几乎主要的数据挖掘技术算法一一罗列,分别介绍在企业实际应用中的表现,不同算法优劣评价,以及大量的实际案例,并且在多处都总结了作者多年数据挖掘商业实战的心得和体会,可以说是作者二十多年来数据挖掘商业服务的经验总结。希望这两本书能够陪伴你收获数据挖掘商业实战的快乐和成就,呵呵! 关于你的第一个问题,我完全同意你的观点,在21世纪的今天,数据挖掘当然应该结合实际工作,并且是偏重应用的。至于目前中国企业的现状以及你提到的招聘单位都是要开发人员,只能解释为这些企业还是错误的把数据挖掘狭隘地理解为IT技术工作,他们不知道,数据挖掘的应用是个典型的多学科多部门的团队作业,其中业务部门(比如营销部门)的参与是自始至终的更是基础和核心(从项目的具体定义到模型的投放应用都不是单纯的模型开发技术人员可以一相情愿地包办成功的)。如果你看了上面的两本推荐的书的话,你会从国外一二十年数据挖掘的商业实践的无数案例中发现,在数据挖掘的商业应用中,最重要的不是挖掘技术模型算法等等技术层面的东西,而是业务经验、项目经验、一种整合相关部门相关知识经验的综合能力。以数据挖掘在企业的市场营销中的应用为例,最核心的最有价值的能力是能兼具营销业务分析能力和数据挖掘技术的复合型能力。 关于你的第二个问题,应该不用回答了,开发人员只是模型搭建的技术人员,离开了具体业务部门(比如营销部,产品开发部)专家的配合,那些模型的价值肯定好不到哪里去;并且一个模型只对一个特定的商业问题起作用,这就不用担心有“傻瓜”模型、“傻瓜”分析。就算你说的情况会出现,即所谓的“那么随着工具的日渐完善,会出现全民皆“分析师”的情况,也就像工具都自动化了,傻瓜化了,分析师就没有存在的价值了”,但是应该不是我们这辈子有机会看见的,一百年两百年后的技术革命,我们大可不必杞人忧天,说不定到那时数据挖掘已成老古董,这跟我们当下的快乐又有什么关系呢? 今年我要全力开拓中小企业的数据挖掘应用服务,关注我的博客,里面有具体项目的分析和总结,效果的评估与应用中的新思维。希望我们互相帮助,新年里共同进步,呵呵,谢谢你,顺祝新年快乐! |
|