分享

数据挖掘实用篇

 昵称14979747 2014-10-26

web数据挖掘应用1  

2012-05-18 16:24:01|  分类: 数据挖掘|举报|字号 订阅

接下来几天谈谈web数据挖掘的相关问题,实际上这也是对Gorden S.Linoff等著的《web数据挖掘:将客户数据转化为客户价值》这本书做的读书笔记。今天先聊聊前三章

一、比较好的句子

摘录了第一章中个人认为比较好的句子

1、数据挖掘不能将一个坏企业变好而只能将一个好企业变得更好

2、数据挖掘能为每一个客户提供定制的、有力的建议

3、满足商业运作的需要是第一位的、无论在何种情况下的数据挖掘都要考虑大环境、从业务角度进行。

4、客户价值衡量的目标应该是增加所有客户的平均客户价值,而不是将重点放在最有价值的客户身上

5、成功的数据挖掘主要在于加深对商业规则和数据来源质量的了解而不是具体的算法。

二、web数据挖掘的方法

包括结构挖掘、内容挖掘和应用挖掘

web数据挖掘并不是单一的活动,而是许多活动的集合。结构挖掘是为提取信息对网站的链接进行分析的过程。对单一网站的局部结构的分析,对于理解比网站的创办目的和识别可能的设计问题很有帮助。对全局结构的分析是一种将一个网站分解成多个紧密联系的子网站的途径。运用全局结构挖掘,有可能把网页归类为中枢(到许多其他网页的很好的跳板网页)和权威(许多网页设计师都觉得值得链接到的网页)

然而,静态链接分析有其自身的局限性。企业不光要知道一个网站会有许多能到达它的链接,也需要知道人们正在如何使用着这些链接,它们中哪些是被人们最多使用的,有哪些可以导致最佳购买。为了回答这些问题,应求助于客户挖掘(应用挖掘),客户挖掘总是跟在客户行为之后的。这意味着我们能够在单一会话(用户开一个浏览器,点击多个超链接,访问服务器多个web资源,然后关闭浏览器,整个过程称之为一个会话),以及在相隔数小时,数日或数月的会话里,在两个页面请求之间识别同一客户。遗憾的是,网站并没有设计成每隔一分钟就去追踪客户,更不用说逐月逐月的。对于这个问题最好的解决方案是需要客户自愿的提供它们的身份,而不是通过结合分析cookies与web服务器日志及应用程序日志,以建立合理的匿名浏览者的行为特征还是可行的

内容挖掘是从www的网页中提取信息的过程。内容挖掘最广为人知的一个应用是搜索引擎,没有它互联网就办的一无是处。内容挖掘应用还有提供签名认证,识别相关网页组,根据网页的写作语言对页面进行标识。

三、在线销售:销售用卡车支付的商品

数十年来,客户价值一直在使用一种叫RFM(最近一次消费(Recency) 消费频率(Frequency)  消费金额(Monetary))的方法,客户被划分为以隔多长时间进行一次购买、购买频率、以及花多少钱等因素为基础的单元,所有东西,如订单平均大小,对特别的促销手段的反应,都能通过RFM来测量。客户自身的订单大小、或作反应的可能性,也能通过它的RFM任务单来推断出来。

RFM特别强大,尤其是因为它能从客户层面上追踪市场活动的角度,为市场部门启动一个优秀的机制。越先进的数据挖掘技术更具有预见性,因为它们利用了更多的变量而不像RFM仅用三个变量。然而,RFM是客户价值运用的最为普遍的技术,也是网络中很好的起点。

下面的一些特征对分析在线购买也很重要

购买频率

购物车的平均大小

购买不同商品的总数

购买不同商品目录的总数

每周的而购买天数和每天的购买次数

对促销和在线赠品的反应

在线购买与离线购买的比较

附件:来自百度百科的RFM应用案例

RFM在传统的直效营销领域的应用 
  作为一种对客户分类的方法,RFM分析模型起初主要用于直效营销(Direct Marketing)领域,目的是提高老客户交易的次数。 
  广东一家办公设备及耗材零售企业,在省内建立了9家连锁配送中心,业务发展迅速,有过成交记录的老客户也多了起来,通过向客户用邮政信函发送商品目录、开展直效营销的成本越来越高。该公司希望找到一种更有效的方法,来区分客户,以便在“更恰当的时间、向恰当的客户传递恰当的商品信息”,从而刺激重复交易,同时也适当降低邮寄费用。

 
  他们把客户最近一次购买日期到当天的天数算出来,得到R这个参数。然后可以依据参数R的大小对客户进行分组,例如可以把客户分成数量基本相等的5个等级,R5级表示最近一次购买时间最接近统计当日,R1级表示最近一次购买时间最远离统计当日;此外还可以依据停止交易的绝对天数、不考虑每级的客户数量是否近似而进行划分。


  对于R5级的客户,该公司会立即再邮寄一份商品目录及奖励积分计划,对于R4级的客户则会在一周内再邮寄一份商品目录及奖励积分计划,对于R3级以下的客户则不采用这重追随购买的邮寄方式。 根据国外的统计结果,R5级客户对直效邮件的回函率是R4级的三倍,因为这些客户刚完成交易不久,所以会更注意同一公司的商品信息。如果及时跟进的邮件内容,采用“交叉销售”(Cross-Sell)或“追加销售”(Up-Sell)的策略,推荐与客户购买需求相关度高的商品,或者提供额外的重复购买奖励,效果更加显著。


  通过大量的统计发现,紧随参数R之后、与重复购买有密切关系的是参数F。采用F购买次数作为参数,将客户分为F5~F1五组,采取不同的邮寄策略也是很有意义的。例如过去6个月购买超过5次以上的客户,今后将每月邮寄一次商品目录;而购买不足2次的客户,将只会每两个月邮寄一次。


  相对而言,参数M与刺激重复购买的频率之间关系不那么紧密。统计发现,如果采用M货币价值这个参数对客户分类,平均交易金额高的客户的反馈率并不见得比平均交易金额低的客户来得多。但这个世界永远存在这样一些客户,他们对一些促销宣传小策略反应冷漠,但偶尔一次的大额采购往往给您带来意外的惊喜。 因此有必要让他们在需要采购的时候能想起您,这就需要利用参数M,同样我们也可以把客户分为M5~M1五组。


  将客户分别按照R、F、M参数分组后,假设某个客户同时属于R5、F4、M3三个组,则可以得到该客户的RFM代码543。同理,我们可以推测,有一些客户最近刚刚成功交易、且交易频率高、总采购金额大,其RFM代码是555,还有一些客户的RFM代码是554、545……每一个RFM代码都对应着一小组客户,开展市场营销活动的时候可以从中挑选出若干组进行。


  RFM非常适用于提供多种商品的企业,这些商品单价相对不高,或者相互间有互补性,具有多次重复购买的必要,这些企业可能提供如下商品:日用消费品、服装、小家电等;RFM也适用于这类企业,它们既提供高价值耐用商品、同时又提供配套的零部件或维修服务,如下:精密机床、成套生产设备、打印机等;RFM对于商品批发、原材料贸易、以及一些服务业(如旅行、保险、运输、快递、娱乐等)的企业也很适用。

阅读(134)| 评论(0)


Michael J.A.Berry等著的《数据挖掘技术——市场营销、销售与客户关系管理领域应用》是我非常喜欢的一本数据挖掘类书籍,不仅是因为书浅显易懂,更主要的是包括的实际案例之广几乎没有其他相关书籍可以比拟。这两天我又重温了这本经典书籍。

照例先抄抄我认为比较好的语句

1、在任何行业,有远见的公司正在向着下面的目标努力,努力了解每个客户个体,并且利用这种了解使客户选择与他们进行商业活动,而不是选择他们的竞争对手。

2、狭义的讲数据挖掘是一系列工具和技术的集合,是支持以客户为中心的组织需要的多项技术之一,广义的讲,数据挖掘是一种态度,它表明商业活动应该是基于认知,分析获得的决策,这比没有任何分析得到的决策好得多。

3、数据挖掘的目标是在数以万亿计的字节中发现有潜在价值的模式,同时,必须对这些模式做出反应,对它们进行处理,最终将数据转化为信息,将信息转化为行动,最后将行动转化为价值。

案例一

一家银行现存在一个业务问题,他们的特别商业产品——家庭抵押贷款额度,不能吸引好的客户。为解决这一问题,银行决定用一系列数据挖掘技术解决这一问题。多年来,银行一直将其数百万零售客户数据存储在一个巨大的关系数据库中,利用这个数据库,能参透与银行保持联系的每位客户的所有关系。

采用数据挖掘工具建立决策树,导出划分现有银行客户的规则,把客户分成两类,即可能或不可能对提供家庭抵押贷款做出反应。经反复检验数以千计购买产品和数以千计没有没有购买产品的客户数据,决策树最终获得判定不同客户之间差别的规则,一旦这种规则被发现,利用得到的模型可以给每个潜在客户记录增加一个属性。这个属性即好的潜在客户标识。

下一步使用后续的模式查找工具,可以确定客户在什么时候最有可能需要这种贷款。这种分析目标就是发现过去曾经频繁处理成功诱因的一系列事件

最后应用聚类自动将具有相似属性的客户分成不同组在某一点上,这个工具发现了14个簇,其中许多簇似乎没什么特点,但有一个簇的特点很明显。39%的人同时具有企业和个人账户、根据决策树分类,这个簇中的客户占到了可能响应者的四分之一。

由于采用了数据挖掘,银行的响应率从0.7%上升到7%

案例二

无线通信行业竞争非常激烈,无线通信公司一直尝试采用新办法,从竞争对手那里挖走客户,并培养自己客户的忠诚度。服务的基本内容就是提供物美价廉的产品,因此无线通信公司考虑吸引新客户的奇异方法

本案例讲的是一家移动通信公司采用数据挖掘,增强开发客户的能力,希望将客户吸引到公司的新的服务项目

这家公司原来想测试一个新产品的市场前景。由于技术原因,他们测试产品的最初覆盖面时只选择了几百个订户——仅占目标客户群的一小部分。

因此,最初的问题是推算谁可能对新产品感兴趣。这是数据挖掘的典型应用:采用最划算的方法,实现能波及到的响应者理想数量。按照假定,定向市场营销的固定成本看成是不变的,每次联系的支出也差不多是固定值,那么要减少活动的总成本,就必须降低联系的数量。

为确保试验的有效性,公司需要有一定的数量的人签约。对于新产品的宣传活动,公司的以前经验是,大约2%-3%的现有客户可能做出满意的响应,因此为达到500名响应者目标,可能需要联络16000-25000名潜在客户

如何选择目标,如果给每个客户打分,排序后,营销人员按这个排序从上至下的打,直到达到理想的响应者数量。

该公司借鉴另一个市场上的类似的新产品推荐的数据,形成训练数据集

将不同数据源汇集后用于构建数据挖掘模型,这个模型可以用于识别购买新产品的候选人,可以采取两种直接邮寄的方式投递:一是按数据挖掘模型的结果产生名录进行投递,二是采用普通商务方法选出的对照组人群。在目标客户中有15%的人购买了新产品,对照组中只有3%的人购买了产品。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多