配色: 字号:
《电子商务企业客户识别研究》——客户生命周期价值分析
2012-06-14 | 阅:  转:  |  分享 
  
1引言

无论是传统企业还是网络平台上的电子商务企业,它们在实施客户保持战略及客户关系管理之前都要解决如何识别出对企业具有不同价值的客户的问题,只有明确了哪些客户是企业最重要的客户和如何识别他们,才能够将企业有限的资源投入到最亟待保持的客户上,最大化企业的价值和利润。客户识别与传统营销理论中的客户细分及客户选择有着本质的不同,传统营销理论是以选择目标市场为着眼点,对整个客户群体按照不同因素进行细分,最后选择企业的目标市场。而客户识别是在已确定好目标市场的情况下,从目标市场的客户群体中识别出对企业最有价值的客户作为企业实施客户关系管理的对象[1]。电子商务企业的客户群体是所有通过点击企业网站进行交易的客户,与传统企业的客户群体有明显的区别,如何从这些客户群中识别出具有不同价值贡献的用户是电子商务企业面临的一个重要问题。客户生命周期价值(customerlifetimeval-ue,CLV)是指企业将来从客户身上得到的利润流的净现值,或是在客户生命周期中产生的有形得益的净价值总额。本文以CLV作为电子商务企业客户识别的指标,通过客户点击流数据确定其CLV,进而按照Pareto的20/80定则划分出核心客户和一般客户,并根据comScoreMediaMetrix(CMM)所收集的巴诺书店1160位客户的点击流数据总量、客户在站点各子页面的点击频次及其比例权重验证基于点击流数据的客户识别方法的可行性和结果的有效性。



2客户识别方法的研究现状

根据Pareto的20/80定则,20%的客户为企业所贡献的价值总额占企业全部客户所贡献的价值总额的80%,甚至更多[2],为了区别于一般客户,核心客户的概念用于概括这20%的特别重要的客户。近年来,国内外对客户识别方法的研究有了较大的进展,采用的指标主要包括客户当年利润及客户生命周期价值,用来衡量客户为企业所贡献的价值总额。客户当年利润是指企业在本年内从客户中获得的收益与相关成本的差额[3],采用该指标识别客户的代表学者有Wayland和Cole、Mulhem以及Rakesh和Gupta等。1997年,Wayland和Cole首先提出将前一期客户利润贡献度作为后一期客户利润贡献度的依据,进而识别企业客户的方法[4]。1999年,Mulhem针对B2B直销模式,提出并设计了一个计算客户当年利润贡献度的模型[5]。2001年,Rakesh和Gupta等人提出了在关系营销中计算现实客户利润贡献度的模型,据此预测当前客户的当年价值,并按照价值的大小排序,进而对企业客户加以区分和识别[6]。然而用客户当年利润作为识别指标有其局限性,该指标只计算客户当年带给企业的利润,未考虑客户在整个客户关系生命周期中未来年份里将带来的利润。有些学者提出了通过客户生命周期价值识别客户的方法。例如,BasDonkers根据客户潜在价值的预测方法以及荷兰多重服务行业CLV的预测模型进行了具有实际意义的研究,并指出各种模型适用的场合,用于企业的客户识别[7]。RajkumarVenkatesan证实了基于CLV选出的客户比用其他指标选出的客户能带来更高的利润,并设计了一个模型优化资源在客户之间的配置,以取得CLV的最大化[8]。PaulDBerger和NadaINasr通过在其CLV模型计算中引入客户保持率参数,构筑了较为完备的参数体系,并展开了富有成效的CLV定量研究,使CLV模型在客户识别中有了实际的应用价值[9]。国内在这方面的研究始于20世纪90年代后期,目前处在影响因素的定性探讨和简化的定量分析阶段。如周晓敏等人从客户吸引力、客户赢利能力、客户关系状况等6个方面定性地建立了客户价值的评价体系,据此将不同价值的客户区别对待[10]。采用CLV作为客户识别的指标虽然克服了客户当年利润识别方法的缺陷,但上述CLV模型针对的都是传统企业,而电子商务企业与传统企业相比,其客户主要是在企业的网络站点上进行在线浏览以及点击交易[11],因此电子商务企业大多是通过客户的点击流数据来反映和捕获客户的行为。点击流数据即指某一站点通过配置站点服务器、代理服务器以及客户机程序插件等来产生反映客户活动的记录,其本质是一种认识论的点击流信息,是通过一定的信息表示手段,将本体论的点击流信息脱离客户而附着到各种网络数据文件中,这些网络数据文件包含了大量的与客户行为相关的细节信息,如客户的基本购买、交叉购买及推荐购买的点击流数据等[12]。对于电子商务企业来说,需要构建基于点击流数据的CLV模型,据此识别企业的核心客户与一般客户。



3基于点击流数据的客户识别方法

针对上述CLV模型的缺陷,引入点击流数据,可以很好地确定交叉购买收益及推荐购买的行为,从而丰富CLV模型,在此基础上进行的客户识别将更客观、具体。利用客户点击流数据进行客户识别,首先要进行点击流数据的收集,然后将数据进行分类整理,在收集和整理的基础上进行数据分析,从而识别出核心客户和一般客户。

3.1点击流数据的收集与传统的商业模式相比,互联网作为电子商务企业存在的基础平台可以向企业管理者提供大量的客户信息,客户在网络上的行为都可以通过其在访问企业站点时的点击流数据来反映[13]。目前点击流数据的获得主要采用日志文件,大多数Web服务器软件常根据3种公开的标准日志文件格式中的一种来记录日志文件。这3种开放格式是NCSA的普通日志格式CLF、NCSA的扩展日志格式ECLF和W3C的扩展日志文件ExLF。也可以采用其他获取方式,比如comScoreMediaMetrix(CMM)所收集的客户点击流数据是通过大量用户的截面数据来判定在线客户行为的服务技术,其特点主要表现在:①常用的日志文件分析工具并不能追踪详细而精确的应用程序数据信息,如客户是将哪种商品放入或取出购物车的、一件交易的数量、支付方式等,CMM所收集的点击流数据有比Web服务器日志更完整、更清晰的格式,这些客户在注册时允许CMM在其浏览器中安装一种程序插件,用于捕获他们浏览站点及交易的各种行为,包括在线、脱机购买行为等;②与其他电子商务企业相比,巴诺在线书店的导航栏、超链接等更为清晰、规范,并具有非常稳定的站点结构,CMM将巴诺书店的站点分为8个基本子页面,即起始页面(home,H)、客户账号页面(account,A)、产品种类页面(catgory,C)、产品栏页面(product,P)、信息页面(information,I)、购物车页面(shoppingcart,S)、订单页面(order,O)、退出页面(exit,E)[14]。

3.2点击流数据的分类电子商务企业Web站点上所包含的客户点击流数据信息是细粒度的,存放了客户的大量信息,如客户姓名、性别、年龄、职业、兴趣及产品购买的记录等。为了更好地利用CMM点击流数据识别企业的客户,有必要对该组点击流数据进行高维化的分类。这是因为对企业的各类客户进行识别首先就要以某些典型客户作为学习样本,从样本客户中提取并选择能够满足可分性原则的最有效的客户特征组合。但客户的原始特征向量是高维的,例如从人口、地理统计方面就有姓名、年龄、性别、民族、住址等信息;在购买行为方面又有购买次数、购买时段、消费额等数据[15]。通过对CMM点击流数据进行高维化的分类,可以将新客户与原有的点击流数据信息进行多维度的匹配,从大量的多维点击流数据中筛选出有用的信息,从而识别出企业的其他客户。对于企业已有的数据仓库来说,其数据挖掘往往仅限于以记录、字段和数据库方式保存的结构化数据,在客户的点击流数据资源中,非结构化的数据(如多媒体、地图、图形、图片、声音和视频数据等)正快速地在现代电子商务企业中占据日趋重要的地位,存储、检索和综合这些数据类型的点击流数据需要先对其进行新的、扩展的高维化分类[16]。CMM点击流数据的高维化分类突出表现在时间维及客户维上,对于时间维,其单位应该是1秒级别的,因为电子商务企业在24小时的任何时间内均可能有点击行为的发生;对于客户维,由于无论客户是否进行了产品的购买,其点击流信息都不加区分地记录下来,因此客户维要进一步细分为3个子类,即发生了在线购物行为的客户、具有惟一ID标识的注册客户及未注册的浏览者[17]。

3.3核心客户与一般客户的识别

3.3.1CLV的测算根据PaulDBerger和NadaINasr的研究成果,企业客户生命周期价值的一般拟合形式可以用(1)式来表示[9]。

其中,n为客户生命周期时间长度;t为客户生命周期中的时间单元;Z(t)为第t个时间单元客户为企业创造的净利润;r为客户保持率;v为折现率。客户为企业创造的净利润Z(t)由于难以直接量化,本文将其表示为(2)式,通过CMM客户点击流的统计数据分别计算其收益和成本,再相减求得净利润Z(t)。

其中,R(t)为第t个时间单元客户为企业创造的收益,包括基本购买收益、交叉购买收益和推荐购买收益;R1为基本购买总收益,是指第t个时间单元全部客户在企业某种类型产品上的基本购买给企业带来的总收益;R2为交叉购买总收益,是指第t个时间单元全部客户在企业其他类型产品上的购买给企业带来的总收益;R3为推荐购买总收益,是指第t个时间单元全部客户向他人推荐企业该类型产品给企业带来的总收益;N1、N2、N3分别为第t个时间单元企业的全部客户在基本购买、交叉购买、推荐购买上的点击流总量;n1i、n2i、n3i分别为第t个时间单元企业第i位客户在基本购买、交叉购买、推荐购买上的点击流总量;C(t)为第t个时间单元该客户给企业带来的总成本,包括产品成本Cp、服务成本Cs、客户开发成本Ca及营销成本Cm。产品成本指企业在产品的升级、维护上所花费的费用;服务成本指企业在售前、售中及售后服务上花费的成本;客户开发成本指企业为吸引客户前来购买所花费的促销费用;营销成本包括产品的推销、市场调研及物流成本等。

3.3.2识别步骤步骤1从电子商务企业的客户点击流数据仓库中获得全部客户的基本购买总收益、交叉购买总收益、推荐购买总收益以及产品成本、服务成本、客户开发成本、营销成本的值;步骤2由公式Z(t)=R(t)-C(t),求得全部客户为企业所创造的净利润Z(t);步骤3将Z(t)代入(1)式,得到全部客户的CLV总值;步骤4根据Pareto的20/80定则,求得核心客户的基准CLV。要识别企业的核心客户与一般客户,可以先根据某位客户的n1i、n2i、n3i的值,由(2)式求得其净利润Zi(t),再代入(1)式得到该客户的客户生命周期价值CLVi,最后将CLVi的值与核心客户的基准CLV进行比较,即可识别该客户的重要程度。



4实例分析及结果验证

4.1相关实例下文以CMM所收集的巴诺书店的点击流数据为实例对企业的客户进行识别。该组数据统计的是1160位客户在2002年4月1日~2002年4月30日期间访问美国巴诺书店站点(巴诺书店是美国最大的连锁书店,网址:http://barnesandnoble.com)的所有点击情况,。考虑1160位客户中的客户5与客户7,由表1可知,在2002年4月1日~2002年4月30日中,n15=3,n25=1,n35=0,客户5的Cp、Cs、Ca及Cm分别为5.3美元、27.5美元、32.1美元、29.9美元;n17=13,n27=9,n37=11,客户7的Cp、Cs、Ca及Cm分别为10.2美元、4.7美元、12.1美元、14.6美元;全部客户购买点击流总量为8305次,其中,N1=5323,N2=1037,N3=1945;企业所获得的图书类产品的R1=351000美元,R2=66000美元,R3=78000美元;总成本为9.8万美元,其中,Cp=7000美元,Cs=27000美元,Ca=33000美元,Cm=31000美元。计算以月为一个时间单元,故变量t=4。根据(2)式得Z5(4)=R5(4)-C5(4)=166.7美元,Z7(4)=R7(4)-C7(4)=1829.6美元。若企业的客户生命周期长度为5年(即n=60),客户保持率r=71.2%,月折现率v=1.25%,则由(1)式可得CLV5=4989.1美元,CLV7=54756.3美元。企业所获得的全部客户购买总收益为49.5万美元,全部客户的总成本为9.8万美元,Z(t)=39.7万美元,由(1)式求得全部客户CLV总值为11881422.8美元。根据20/80定则,可得核心客户的基准CLV=(1/1160)×(80%/20%)×11881422.8=40970.4美元。据此,企业应该将客户5归为一般客户,将客户7归为核心客户。

4.2结果验证根据客户5与客户7的基本购买点击流总量、交叉购买点击流总量、推荐购买点击流总量的数值大小,他们的产品成本、服务成本、客户开发成本及营销成本在各自总成本中所占权重的大小以及他们的点击流数据序列见表2,可以对上述识别结果进行验证。对于一般客户来说(即客户5),客户一般未产生交叉购买意图及推荐购买的倾向,企业只能从中获得一些基本的购买收益。所以,在客户5的n15、n25、n35三者之间,n15最大,n25、n35则很小,甚至为0;而且,在客户5的Cs、Ca、Cm及Cp中,Cs、Ca、Cm占据较大的权重,分别为29.0%、33.9%、31.5%,Cp的权重相对较小,为5.6%;另外,由表1可知,客户5的点击流数据总量为4,且在该组点击流数据中,I的点击频次最高,其次是H和C;S及O的点击频次则很低,均为0次;其站点转换率及重复点击率均较高,故可确定他为一般客户。对于核心客户来说(即客户7),客户往往出现交叉购买及推荐行为,企业除了获得基本购买收益外,还可以获得交叉销售收益及推荐收益。所以,客户7的n17、n27、n37取值均较大,且n27、n37有上升的趋势;而且,在客户7的Cp、Cs、Ca及Cm中,Cp的权重逐渐上升,为24.5%,Cs、Ca、Cm的权重则逐渐下降,且Cs下降的最为明显,分别为11.3%、29.1%、35·1%。这是因为随着企业与核心客户之间关系的深入,企业用在产品的升级、维护上所花费的费用将越来越大;而随着双方信任的不断增加,配合日益默契,核心客户的服务成本将降至最低。另外,由表1可知,客户7的点击流数据总量为33,且在该组点击流数据中,P、C、I均占据较大的比例;点击行为集中在一定的产品品牌站点之内,表现为C的重复点击率很高;相应的,其站点转换率及品牌级网页转换率均较低,点击的焦点页面为品牌级页面,故可确定他为核心客户。



5结束语

客户资产正在成为企业最有价值的资产,许多企业都开展了各种客户关系管理项目,建立客户数据库,以实现对客户资产的有效管理。对于电子商务企业来说,由于客户在企业网站上的行为可以通过其在访问站点时的点击流数据来反映,所以电子商务企业可以建立客户点击流数据库,以加强对客户资产的管理。而客户识别作为企业实施客户保持策略及客户关系管理的必备前提,使企业有必要对其客户加以区分与识别。本文提出的基于点击流数据的客户识别方法对于电子商务企业开展客户识别具有借鉴意义,没能同时针对传统企业进行定量实证研究是本文的一个不足,主要原因除了其点击流数据来源困难外,还有以下几点影响因素。①客户购买后企业提供的后续的免费服务———即服务成本因素;②企业所提供的不同产品或服务的连带性,连带性强顾客购买一种产品产生良好印象后,将会带动另一种产品的销售,从而产生较大的间接贡献;③企业客户CLV的测算需要完整的历史交易数据来追踪和理解客户行为,所以传统企业要准确地测算CLV极为复杂。但随着传统企业网络站点创建的不断普及以及点击流数据仓库结构的日趋规范,面向主题的点击流数据将给传统企业通过CLV的定量测定来识别客户带来极大的方便,这是一个值得深入探讨的问题,也是作者正在致力于研究的课题。
献花(0)
+1
(本文系不丁财神首藏)