分享

移动数据挖掘项目工作总结

 西山刀客 2012-10-25

  --2012年10月23日,中山大学,园东区203

  电信行业是数据挖掘技术应用的传统行业,其挖掘题材之丰富,其挖掘应用之广泛,一直令不少数据挖掘专家迷恋不已。移动凭借其自身行业的特性,以及成熟稳定的客户群体等诸多优势,从挖掘题材的创新、挖掘技术的运用以及后期营销活动的开展,都走在了行业领域的前列。

  本文主要是作者在移动行业方面的一些经验分享、工作总结以及思考感悟。移动数据挖掘项目具有设计简单、重视应用、开发周期短等特点,其中的一些挖掘分析思想值得我们借鉴学习。

  从数据说起

  我们所说的数据分析,或者数据挖掘,就是期望从数据中获取有用的信息。数据,对数据分析人员来说,就像厨师做菜所需要的各种食材。好的食材,再加上适当的烹饪,就可以做出美味可口的饭菜。同样地,好的数据,也是进行有效数据挖掘的基础。

  一个行业,或者一个企业,是否能够广泛而成熟地运用数据分析来辅助进行营销决策,较大程度上取决于我们从数据层面知道关于客户信息的多少。最理想的情况下,我们期望能够获得描述客户心理活动方面的数据,但现实中这方面的数据其实是不可能获得的。而数据挖掘,更多的是力图从企业现有的数据中探寻有用的信息。

  现在回过头来看,移动的行业特性,及其刻画用户的数据维度较为全面,使得移动能够广泛成熟地应用数据挖掘技术来辅助营销决策。一般地,移动有几大方面的数据:

  1) 客户基本信息,

  2) 账务信息,

  3) 通话行为,

  4) 数据业务,

  5) 集团业务,

  6) 渠道使用,

  7) 交往圈,

  8) 终端特征,

  9) 位置信息,

  10) 客服数据

  相比之下,其他行业的数据就不那么全面了。移动数据的特点,也使得数据挖掘在营销决策方面有很大作为。从客户流失、客户分群、客户价值、客户偏好、精确营销到客户生命周期等经典的挖掘题材,都有良好的数据支持。

  咨询的方法、业务的思路、挖掘的技术

  数据挖掘项目从业务问题出发,致力于从数据中寻找解决之道,最后回到业务层面上,提出应用建议,支持营销决策。业务,实际上是贯穿数据挖掘模型的整个过程。分析人员应该基于业务,忠于业务,时刻保持对业务的那种敏感性。不懂业务,不算一个优秀的分析人员。不懂业务,就会使我们分析的方向越来越偏离挖掘的最终目标。不懂业务,分析结果就仅仅只是一堆数据,从当中得不到太多有意义的信息。

  因此,对业务问题的分析思路还是要基于业务来确定。在业务的基础上灵活设计分析模型,可确保模型结果较好地运用到营销决策之上。

  值得注意的是,对业务问题的分析过程,挖掘只是其中的一部分,而不是全部。我们需要逻辑思考,我们也需要咨询的方法论来指导我们去剖析业务问题,以便让业务问题的解决顺理成章,让业务部门更好地明白我们对业务问题的分析思路。

  这里举个客户流失的例子来加以说明吧。对于客户流失,可能其他行业只是开发一个客户流失预警模型出来,就差不多了。但在移动,这会做得更多。对于流失客户,我们首先想知道客户流失的总体情况、客户流失轨迹如何、流失客户群体有什么样的特征等等。进一步地,我们也想知道客户为什么流失、客户流失之后的去向如何。除了这些,我们还需要知道哪些客户容易流失、这些客户有什么样的偏好特征等等。从这我们可以知道,业务问题的分析需要遵循一定的逻辑性,需要像讲故事一样非常自然合理的解决思路。

  我必须得告诉你,这就是一般逻辑性思考的套路。我们也看到,利用数据挖掘技术(如Logistic回归)开发挖掘模型,可能就只是我们分析思路中的一部分工作而已。

  另外,需强调一点,我们在分析过程中,应当为业务人员想得更多。这点不多加说明。

  我认为,在数据挖掘项目中,关键在人,业务是其次的,第三才是技术。建模应当遵循简单有效的原则。所谓简单,即是力求模型避繁就简。比如说,训练指标设计,可以基于业务先衍生出几个含义明显且计算逻辑简单的指标,尽量避免衍生出那些业务不明显且计算复杂的指标。再者,训练指标不能太多,否则会耗费太多时间在搭建训练宽表上。又如在挖掘技术的选择上,如果用Logistic回归、决策树和神经网络训练模型,得到相差不大的结果,一般选用Logistic回归来训练模型,因为它原理简单并且结果可读性好。

  着眼于应用

  我们的项目成果是否有价值,我们开发的模型是否有效,最终得看应用。从项目一开始,我们就应着眼于成果的应用。我们必须顾及业务人员的感受。有时候,我们得站在业务人员的角度来思考我们所分析的问题。

  我们还应该告诉业务人员,我们的模型怎么用。这是我们的职责。我们还需要告诉他们,模型有何局限性。如果有必要,我们也可以告诉他们整个分析过程,从目标定义、数据处理、指标选取、模型训练到结果应用。让他们知晓这个过程,是为了让他们对模型有一个正确的认识,既不会完全否定模型的作用,也不会过于看重模型的效果。

  这里存在着模型效果衰减的问题。模型自身的效果会受到各种营销因素的影响而降低,导致最终营销效果不好。举个例子,从客户流失预警模型中获取的目标客户名单,从模型自身效果来看,会有比较高的命中率。但业务人员对这部分客户进行挽留关怀,也收到挽留策略等因素的影响,导致成功率不高。这是难以避免的问题。我们能做的只是采取措施减少这样的影响。

  由于行业特性以及移动自身的优势,挖掘项目成果在移动得到了很好的应用。移动的渠道发展趋于多元化,营销方式多样化,客服体系成熟,客户规模庞大,这都使得挖掘成果得到有效的应用起来。其实,当你收到来自10086的优惠短信,很有可能,你就是经过挖掘分析得到的结果,你就是被锁定的目标客户。不过,不要惊慌,这很正常。这表明移动对你重视了。

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多