分享

车险理赔消费者体验的数据挖掘

 毓灵之秀 2016-07-05

  【摘  要 本文旨在从车险理赔消费者体验调研数据中,挖掘车险理赔工作的关键改进点,有针对性地提出政策建议,提高资源利用效率,提升保险消费者保护水平。本文遵从CRISP-DM数据挖掘方法论,使用因子分析法,构造了负项均值偏离占比模型,得到了车险理赔消费者体验三个最迫切的改进点,分别是:车险理赔咨询和投诉处理速度、车险理赔速度、车险理赔查询。本文相应提出了改进的政策建议,分别是:理顺投诉处理流程、理赔查询平台集中化、继续提高车险理赔速度、持续进行消费者体验调研和问卷优化。本文最后估测了政策建议落实后,车险理赔消费者体验的可能提升度水平,并提出了智慧型保险消费者保护的倡议。

  【关键词】  车险理赔;消费者体验;数据挖掘;消费者保护

  【中图分类号 F840.32

  一、问题的提出

  随着中国经济的快速持续增长,中国保险事业也迅猛发展,车险业务一直是财产保险公司的主打业务,占比一般达到70%以上,甚至有财产保险公司的车险业务占比达到90%。车险业务的经营非常依赖于理赔服务,然而,保险公司长期以来形成了重业务发展、轻理赔服务的经营思路,严重影响了车险理赔服务的质量。目前,人民群众对保险行业投诉最多、意见最集中的领域,就是车险理赔。近年来,中国保险监督管理委员会致力于提高车险理赔工作透明度,努力提升车险理赔效率,不断出台相关监管规定,保险行业的理赔服务有了一定改善,但距离社会认同和车险消费者期望的水平,还存在不小的差距。各保险公司,特别是新兴财产保险公司,必须在理赔服务方面形成优势和特色,才能吸引新客户,留住老客户。因此,应用科学方法,研究车险理赔消费者体验的影响因素,挖掘车险理赔工作的关键改进点,从而有针对性地提出改进对策,才能有效地提高车险理赔服务水平,提升车险消费者满意度和忠诚度,做好车险消费者保护工作。

  本文应用数据挖掘技术,专题研究车险理赔消费者体验,有四个方面的意义:第一是应用科学方法,研究车险理赔消费者体验的影响因素,挖掘车险理赔工作的关键改进点,从而有针对性地提出改进对策,提高保险公司的资源投入效率;第二是努力提升车险理赔工作效率,改进车险理赔服务,提高车险消费者满意度和忠诚度,改善保险公司形象,提升保险行业的声誉;第三是发现并抓住车险理赔难的关键制约因素,集中资源加以解决,做好车险消费者保护工作;第四是在中国保险运营领域,对数据挖掘技术和工具的适用性加以检验,推广和普及数据挖掘技术,助力中国保险行业的转型升级,打造中国保险行业的长期竞争能力。

  二、数据挖掘研究的过程

  数据挖掘(Data Mining),是用已验证的方法论,从海量数据中,发掘出可采取行动的内在知识,从而改善企业运营,提高效率。数据挖掘又称为数据库中的知识发现(Knowledge Discovery in Database)。它是从大量的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、人们事先不知道的、但又是可信的、潜在的和有价值的信息和知识的过程[1]。一般统计研究需要研究者的预判,重视假设检验;而数据挖掘鼓励研究者的探索和新知识的发现,重视实践检验。数据挖掘在保险行业,可用于保险客户细分、营销活动响应、交叉销售和追加销售、代理人甄选、流失预警及客户挽留、欺诈监测、新险种开发和车险费率模型化等诸多领域。保险业应用数据挖掘技术在国际先进国家已有许多成功案例,但在国内保险行业中,数据挖掘应用仍处于启步阶段。

  本文的研究采用跨行业标准数据挖掘方法论CRISP-DM(Cross-industry Standard Process for Data Mining),它将数据挖掘分成六个阶段:商业理解、数据理解、数据准备、建立模型、模型评估和模型发布,它强调的是数据挖掘在商业中的应用,解决商业中存在的问题,而不是把数据挖掘局限在研究领域[2]

  (一)商业理解

  本数据挖掘的业务目标是:分析消费者在车险理赔过程中,形成不满意体验的影响因素,研究消费者对车险理赔服务水平进行不满意评价的潜在关键点,从而找到保险公司车险理赔服务目前最迫切的改进点和“理赔难”的瓶颈点,提出有针对性的车险理赔政策改进建议,争取高效率地提高车险理赔消费者体验水平,提升车险消费者的满意度和忠诚度,做好车险消费者保护工作。

  (二)数据理解

  研究者在某保险公司组织进行了车险消费者体验调研,首先进行文献研究和定性调研,通过走访消费者,总结了车险消费者体验的影响因素;再根据影响因素,编制调研问卷,进行定量调研。本次数据挖掘所需要的车险“客户理赔体验研究”,包含在调查问卷中(问卷中相关的具体内容详见附录),本文以此作为数据挖掘的基础数据。通过对数据和问卷问题项的分析和观察,问卷问题项之间存在关联关系,所以本次数据挖掘初步选用因子分析法。

  问卷中的b016项问题,反映的是消费者对于理赔服务总体的体验,根据该问题消费者回答的数据,将该问题项选择数值大于4的消费者,列为“A类:理赔服务体验良好消费者”(以下简称A类消费者),该问题项选择数值小于4的消费者,列为“B类:理赔服务体验不良消费者”(以下简称B类消费者)。考虑到本次数据挖掘研究的主要目的是找到车险理赔消费者体验最迫切的改进点,也就是主要研究其不满意点,因此只对B类消费者的数据重点进行后续研究。

  (三)数据准备

  1、首先进行尝试性因子分析:

  将B类消费者的因素b001至因素b015的问卷数据进行尝试性因子分析,得到B类消费者的旋转因子载荷阵表(表1)。  

  表1  旋转因子载荷阵表 

B类消费者--Rotated Component Matrix

因素

Component

F1(49%)

F2(9%)

F3(7%)

F4(7%)

b002

0.83

0.06

0.26

-0.01

b006

0.8

0.11

0.26

0.25

b008

0.78

0.32

0

0.32

b005

0.77

0.25

0.29

-0.02

b004

0.74

0.25

0.16

0.31

b003

0.63

0.38

0.29

0.03

b007

0.47

0.69

0.2

0.08

b009

0.14

0.89

0.07

0.07

b010

0.21

0.66

0.32

0.35

b012

0.11

0.14

0.76

0.24

b001

0.37

0.13

0.76

-0.16

b011

0.37

0.16

0.51

0.38

b014

0.43

0.39

0.45

0.24

b015

0.09

0.09

0.04

0.88

b013

0.29

0.32

0.39

0.53

  2、然后进行因子推断:

  参照上表,对不良体验车险理赔消费者的影响因素推断如下:

  1) F1因素可以理解“理赔人员”体验

  当发生不良体验时,消费者对理赔服务有如下体验:“态度不积极”、“服务人员不专业”、“对消费者不关心”、“解释不耐心”、“对消费者的疑问关注不够”、“查勘到场不及时”。针对F1因子,保险公司宜考虑加强理赔人员的培训,在提供理赔服务过程中,加强对消费者心理方面的安抚,并且积极耐心地向消费者提供相关的理赔服务信息,提高理赔服务人员的专业水平。同时对于因特殊原因不能及时到达事故现场的,应主动向消费者道歉并解释,求得消费者谅解。

  2)F2因素可以理解为“理赔便利”体验

  当发生不良体验时,消费者对于理赔相关材料提交的便利性、就近上门的便利性产生了不良感觉。保险公司宜考虑在资源允许的情况下,适度的提高车险理赔便利性。

  3)F3因素可以理解为“信息充分”体验

  当发生不良体验时,消费者对于保险公司的理赔信息提供不满意,保险公司宜及时通知消费者理赔相关事项,或提供多样的理赔进度查询,保证消费者对于理赔服务的进展状况的了解,使消费者安心。

  4)F4因素可以理解为“沟通速度”体验

  当发生不良体验时,消费者对理赔咨询、理赔投诉的处理及时性有一定的不良感受。因此保险公司宜考虑在资源允许的情况下,尽量缩短理赔咨询、理赔投诉的处理时间,提高服务效率,减少不良体验。

  (一)建立模型

  1、因子分析模型

  使用因子分析法,分别得到B类消费者理赔体验因素的方差分解主成分提取分析表(Total Variance Explained,表2)和初始因子载荷矩阵(Component Matrix,表3)。

  表2  方差分解主成分提取分析表

主成分

提取载荷平方和(Extraction Sums of Squared Loadings)

总量(Total)

方差百分比

(% of Variance)

累计百分比(Cumulative %)

1

7.349

48.991

48.991

2

1.341

8.939

57.930

3

1.032

6.882

64.813

4

1.008

6.722

71.534

    从表2看出,模型累计解释能力(Cumulative %)达到71.534%,一般而言,模型的解释能力超过60%,就表明调研量表具有良好的结构效度,因此B类不良体验消费者宜作为本次数据挖掘的重点对象,所提取四个主成分可以基本代替原来的15个因素变量。

  表3  初始因子载荷阵表(Component Matrix)

因素

因子(Component)

1

2

3

4

b001

0.609

-0.248

0.512

-0.257

b002

0.729

-0.464

-0.026

0.129

b003

0.761

-0.178

-0.072

-0.112

b004

0.807

-0.105

-0.166

0.215

b005

0.782

-0.351

-0.063

-0.028

b006

0.808

-0.241

-0.041

0.256

b007

0.758

0.077

-0.237

-0.317

b008

0.798

-0.102

-0.346

0.220

b009

0.558

0.345

-0.343

-0.515

b010

0.698

0.413

-0.047

-0.220

b011

0.678

0.129

0.272

0.138

b012

0.550

0.179

0.576

-0.077

b013

0.685

0.345

0.130

0.134

b014

0.746

0.089

0.107

-0.076

b015

0.389

0.599

-0.032

0.538

  参照上面的两个表,可以计算四个主成分的影响因素的系数(以初始因子载荷阵的数据除以主成分特征根的平方根)。得到的四个主成分后,进行加权汇总,即可得到综合得分模型如下:

  YB=0.152×b001+0.144×b002+0.156×b003+0.197×b004+0.151×b005+0.198×b006+0.148×b007+0.178×b008+0.098×b009+0.196×b010+0.224×b011+0.206×b012+0.235×b013+0.201×b014+0.210×b015

  综合得分模型中,每个影响因素的系数就是该影响因素对于综合评分的解释能力,反映了其重要性。

  2、均值偏离水平模型

  为了度量各影响因素需要进行改进的迫切程度,需要构造均值偏离水平模型,将各因素的重要程度和消费者满意度,两者其平均水平的欧几里德距离,作为改进迫切程度的评价标准,具体公式为:

  均值偏离水平=sign(各影响因素的满意度-平均满意度)×sqrt ((各影响因素的满意度-平均满意度)^2+(各影响因素权重-平均权重)^2)

  由上式计算,可得到B类不良体验消费者均值偏离水平表(表4)。

  表4  均值偏离水平表

问题项

均值偏离水平

问题项

均值偏离水平

b001

-0.06

b009

0.48

b002

0.24

b010

-0.07

b003

0.07

b011

-0.05

b004

0.11

b012

-0.28

b005

0.17

b013

-0.28

b006

-0.05

b014

-0.10

b007

0.07

b015

-0.51

b008

0.23

 

 

    均值偏离水平为负值的影响因素,显示消费者对该影响因素的满意度低于消费者对所有影响因素的平均满意度。均值偏离水平为负值的影响因素共8项,分别用各负项均值偏离水平与所有负项均值偏离水平之和进行比较,就得到各影响因素的负项均值偏离程度占比,详见负项均值偏离水平占比表(表5)。

  表5  负项均值偏离占比表

问题项

均值偏离度

问题项

均值偏离度

b001

4.5%

b012

19.9%

b006

3.6%

b013

20.2%

b010

4.7%

b014

7.2%

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多