分享

人工智能在银行工单处理中的应用

 taotao_2016 2019-02-09
人工智能在银行领域的影响也在不断扩大,已形成了量化投资、智能柜台、智能客服等新型业务模式,为客户提供了崭新的体验。银行服务智能化已经是大势所趋。
991

目前,以机器学习为代表的人工智能技术在全球兴起热潮,其理论、技术和应用场景都有了长足发展。特别是依靠海量数据和强大的分布式计算能力,人工智能已在语音识别、图像识别、自然语言处理、人机对弈、自动驾驶等领域取得显著或者突破性进展,使得传统的经验密集型行业迎来了智能化改造的历史机遇。

        人工智能在银行领域的影响也在不断扩大,已形成了量化投资、智能柜台、智能客服等新型业务模式,为客户提供了崭新的体验。银行服务智能化已经是大势所趋。商业银行的工单处理是与客户体验息息相关的重要工作,要求处理人员具有丰富的金融知识和很强的分析能力,是一项经验密集型工作,适合进行智能化改造。本文结合实际工作,就人工智能在商业银行工单处理系统中的应用进行探讨。

一、 商业银行工单处理现状及问题

        大型商业银行每年需要处理数以万计的工单。目前的工单处理系统仅在工单报送、审批、存档等办公事务性环节实现了自动化,在最主要的问题分析处理环节,还是主要依靠人工。

        随着IT系统规模日趋庞大以及新业务功能与日俱增,大型商业银行每日需处理的工单数量呈上升趋势,维护人员处理工单的难度逐渐增加。从我们处理工单的实际情况看,以下几方面问题日益突出:

        (1)工单所属系统的识别准确性不高。目前工单分派是根据业务人员填写的工单所属系统进行自动分派,导致工单分类的准确度不高,经常出现工单分派错误的情况,影响了工单的顺利流转。

        (2)问题定位不够准确。由于处理人员经验不足,可能造成问题定位不准确,形成有偏差的解决方案。这不但无助于解决问题,还进一步降低了客户体验,增加了系统运行风险。

        (3)不能快速匹配历史工单。由于软件缺陷、客户误操作等问题,相似的工单会重复出现,这是工单处理工作中的常见现象。有经验的处理人员经历了长时间的经验积累,或者知识总结,能很快找到类似的历史工单,参照历史处理方案进行处理,确保处理高效率。由于人员的流动性,新的人员无法在短期内具备这种能力,造成了低效的重复劳动。

        这些问题,对工单流转效率和处理质量造成了影响。特别是需要多个团队配合的工单,如果部分环节处理不及时,会延长工单处理的时间,从而降低服务质量,影响银行形象。

二、 商业银行工单处理智能化概述

        1.工单处理智能化需求

        客户是银行赖以生存和发展的基础,完善客户体验是银行提高服务质量的根本目标。作为银行信息科技体系技术支持部门,和客户最直接的联系就是工单处理系统,维护人员通过工单处理系统接收、分析、处理客户反映的问题。工单处理的效率和质量,直接影响到客户对银行的认可度。鉴于目前工单处理系统中存在的问题,有必要考虑在工单处理系统中应用人工智能技术,以提高工作效率和质量,提升客户体验。

        同时,商业银行积累了大量的历史工单数据,这些数据既有问题描述信息,又有问题归属分类,还有问题解决方案,构成了工单问题及处理方案的全景信息。海量历史工单数据中蕴含了工单处理需要的大部分业务知识和处理规则,为人工智能特别是机器学习提供了极好的数据来源。从必要性及可行性上看,商业银行工单处理智能化改造正逢其时。

        从商业银行同业情况来看,工单处理智能化目前处于研究和起步阶段。随着各银行对提高工单处理的效率和质量日益重视,工单处理智能化将展现出很好的应用前景。

        2.工单处理智能化涉及的技术领域

        工单处理智能化是在传统的工单处理流程基础上,用人工智能技术手段分析、处理工单,实现自动匹配类似工单、自动推送解决方案、自动汇总工单类型等功能,达到减少工作量、提高工作效率和提升服务质量的目标。

        工单处理智能化首先要解决的问题是:如何从非结构化的工单描述(一连串语言符号)中获取问题工单描述信息特征和解决方案信息特征。因此工单处理智能化技术首先涉及人工智能的自然语言处理领域。当然,工单智能化的语言识别不同于一般的机器翻译或者专家系统自然语言接口,它描述的内容有很强的领域范畴,即银行业务领域、IT技术领域,工单描述语言中的上下文关联和语义环境,和专业领域有很强的关联关系。同时,工单描述语言分析还需要减少无效词汇对语义理解的干扰,使得银行工单处理智能化需要适合自身特点的自然语言处理能力。

        在获取工单描述文字的特征信息后,智能工单处理系统需要对特征进行分析、分类,以确定工单归属系统或者所属类型。同时,还需要从历史工单数据中匹配出该类型工单及其解决方案,供处理人员参考。这里涉及的特征提取、分类和匹配,属于人工智能的机器学习领域。

三、 智能工单处理系统简介

        为了提高工单处理的效率和质量,提升客户体验,也为了顺应人工智能技术在银行领域应用的潮流,我们在现有的银行工单处理系统中引入了人工智能技术,设计、开发了智能工单处理系统。该系统将大量非结构化的工单描述信息和知识库中的知识条目,通过机器学习算法加以分析处理,实现工单自动转派及方案智能推荐。同时,通过对工单描述主题归类,挖掘出有价值的信息,为工单分派与处理方案提供数据与决策支持,提升分派工单的准确性。

        智能工单系统采用常见的WEB+MySQL for AIX架构。为便于实现统计分析功能,采用R语言为开发语言。

        1.应用架构

        通过运维流程管理平台扩展接口,可以设置参数实现工单处理智能化实时切换,实现了运维流程管理平台和智能工单处理系统的松耦合协同工作。图1为应用架构系统逻辑关系。

1.jpg

        2.系统功能

        (1)批量功能

        智能工单处理系统定期通过批量接口从运维流程管理平台获取历史工单数据,包含工单内容、解决方案和所属系统等内容。导入触发条件可以指定为一段时间(如每周或每月),也可以指定新增历史工单达到一定数量(如新增1000个工单)。

        智能工单处理系统对导入的历史工单数据进行特征提取和分类批量计算,用计算结果修正现有的主题模型。

        主题模型每次更新后,通过统计批量程序绘制出当前的工单主题特征全景图,同时更新工单主题库和知识条目库。

        (2)联机功能

        联机功能是向运维流程管理平台的工单分派、工单处理提供的自动化功能。

        平台分派工单时,先调用智能工单处理系统提供的联机接口,输入待分派工单的信息;然后智能工单处理系统返回该工单所属系统信息,运维流程管理平台将该工单分派给相应的团队处理。

        维护人员在处理工单时,平台先调用智能工单处理系统的接口,输入工单信息,智能处理系统返回该工单所属知识条目、最匹配类似历史工单等相关信息,供处理人员参考。

四、 系统中的人工智能技术及实现

        在智能工单处理系统中,工单主题模型及主题库是体现系统“智能”的功能模块。智能化功能模块采用的模型和算法,就是人工智能应用在本系统的关键技术;模块的智能水平决定了本系统工作的效率和质量。

        从理论上讲,本系统的智能化功能模块是以统计论和概率论为基础,利用机器学习算法让机器具有类似人类的自动“学习”能力——对已知的训练数据做统计分析从而获得规律,再运用规律对未知数据做预测分析。其基本过程是:标注——利用人工对一批文档进行了准确分类,以作为训练集(进行机器学习的材料);训练——计算机从这些文档中挖掘出一些能够有效分类的规则,生成分类器(总结出的规则集合);分类——将生成的分类器应用在有待分类的文档集合中,获取文档的分类结果,该系统以海量历史工单数据为训练集,进行了文本分词、去干扰等预处理;在此基础上进行特征分类训练,实现了特征向量的自动匹配。

        本系统智能化机器学习功能主要流程图2所示。

2.jpg

        1.确定训练样本集

        为保证足够的训练样本数量,也为保证较新的数据时效性,我们确定以运维流程管理平台近几年的工单数据作为智能工单处理系统的数据训练样本集,总量约5万。

        工单数据的主要字段包括:工单ID、类别、子类、条目、请求描述、所属系统、处理团队、申请来源类别、申请来源名称、报送原因分类、处理方式分类、解决方案描述、是否变更等共50个左右的数据项。

        历史工单导出后的数据为XML纯文本,便于后续的文本分析和web展现。

        2.工单文本预处理

        文本预处理主要包括文本分词和分词过滤两项工作,主要作用是按照行业词汇集将工单文本进行词汇划分,然后将结果中那些对语义识别无效或者有害的分词去掉,以实现工单特征信息的充分暴露,便于下一阶段的特征分析、分类工作。

        (1)中文分词

        在使用向量模型表示文档时,首先要对文档进行词汇化处理。我们选用了常见的Rwordseg作为智能工单系统的文本分词工具,它的核心算法采用隐马尔科夫模型(Hidden Markov Model, HMM),适用于人名识别、地名识别、组织机构名识别、多级词性标注、关键词提取、指纹提取等领域,并能很好地支持R语言及中文字符集。

        为突出工单数据的金融行业特征,我们使用了CFA金融专业词典作为自定义词典,使得系统具备了良好的金融行业分词能力。

        (2)分词过滤

        工单描述文本中有大量的问题特征无关词汇,比如大部分的感叹词、形容词、连词,以及客户姓名、地名等停用词、公共词,或者低频词、专有词。这些词汇经常出现,但几乎不包含任何工单问题特征信息,还可能弱化工单特征信息的表现,影响特征分析和分类。我们收集了此类词汇(含规则)数百个,形成了干扰词汇(规则)集,便于对分词结果进行过滤操作。

        经过文本预处理之后,工单数据已初步显现出主题特征信息,可以进行主题特征分析、分类工作了。

        3.设置特征向量权值

        由于每类词汇对工单主题的影响是不一样的,因此工单主题特征的每个向量的权重值也是不同的。在完成分词之后,我们对词语的位置信息做进一步的发掘,需要确定记录位置信息的方式以及各个位置的词在反映主题时的相对重要性。标题、摘要和结论、正文等文章各个部分的位置权重是各不相同的,当软件逐词扫描统计词频时,记录每个词的位置信息。适当的、有区分的设置特征向量权值,能够显著提高特征分析的准确性。

        4.主题特征提取

        主题特征提取是人工智能模式识别领域的重要方法,它通过分析不同文档中的各类词汇出现的频率或者概率,找到文档类型和词汇之间的内在关联规则,从而实现对文档特征的分析和提取。
在智能工单处理系统采用了主题模型在海量训练数据中自动寻找出文字间的语义主题,以及对工单中的主题进行分析。

        主题模型就是将工单数据训练集中每篇文档的主题以概率分布的形式给出,从而通过分析一些文档抽取出它们的主题后,便可以根据主题进行主题聚类或文本分类。主题模型中,一篇文档是由一组词构成,词与词之间没有先后顺序的关系。此外,一篇文档可以包含多个主题,文档中每一个词都由其中的一个主题生成。

        从概率模型上讲,每个工单文档的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到的。那么,如果要生成一篇文档,它里面的每个词语出现的概率为(p为加权后的概率):

3.jpg

        上面这个式子,可以矩阵乘法来表示,即:

4.jpg

        对任意一篇文档,左边的矩阵是已知的,右边的两个矩阵未知。而主题模型就是用大量已知的“词语|文档”矩阵,通过一系列的训练,推理出右边的“词语|主题”矩阵和“主题|文档”矩阵。

        我们选择用线性判别式分析算法(Linear Discriminant Analysis, LDA)进行工单主题分类。LDA也叫做Fisher线性判别(Fisher Linear Discriminant ,FLD),是模式识别领域的经典算法。LDA的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。工单主题特征属于高维向量空间,适合采用LDA算法进行主题分类。

        5.训练分类器

        计算机从这些文档中挖掘出一些能够有效分类的规则,生成分类器(总结出的规则集合);工单主题的分类是通过对分类器进行大量有标签的数据训练实现的。

五、 智能工单处理系统的成效

        我们对智能工单处理系统的智能模块进行了训练,并将训练好的系统投入运维流程管理平台进行了试运行,取得了良好效果。

        1.自动预测工单归属分派,减少流转次数

        工单分配归属系统时,不再简单依靠报送人填写的系统名称,而是结合工单具体描述问题,确定工单归属系统,并分配到相应团队。统计结果显示,应用智能工单处理系统后,工单首次分配错误率大幅降低,显著减少了误分配次数。

        2.统计工单主题分布,挖掘潜在生产问题

        智能工单处理系统可以通过批量方式统计提取指定工单集的主题分布全景图。通过主题分布全景图,可以直观地看出每个主题对应的工单分布情况,包括数量以及变化。维护人员通过重点关注分布全景图中那些工单数量很多,或者近期数量变化显著的工单类型,分析此类工单的产生原因,比如是否存在系统问题,或者用户误操作问题等,利于及时处理问题,提高系统的可用性及稳定性,提升客户体验。

        3.匹配历史工单,提高处理效率

        智能工单处理系统可以对每个新报送的工单进行通过特征提取,从历史工单库中匹配出最类似的工单。处理人员可以参考历史工单的问题描述、解决方案等重要信息,大大提高了工单处理效率。智能工单处理系统已成为了维护人员常用的实用工具。

        4.提供知识条目预测,提升解决方案准确性

        智能工单处理系统通过优化工单处理流程,建立并丰富了流程平台知识库中知识条目。系统通过对每一张工单对应知识库知识条目的学习,不断提高推荐知识条目的准确性。随着工单种类的数量的不断增多,知识库条目的不断丰富,解决方法匹配程度也会越来越高。

        实践表明,在银行工单处理系统中应用人工智能技术,能够显著提高工单处理效率,减少流转环节,并挖掘潜在生产问题,促进生产维护工作。

        我们的智能工单处理系统使用了机器学习的主题模型实现了工单主题特征的提取、分类和匹配。而在当前人工智能热潮中,神经网络特别是深度学习网络的应用领域越来越广泛。深度学习是近十年来人工智能发展的新成果,在近期赢得了广泛关注,适合解决复杂、非线性的分类或者回归问题,比如图像识别、语音识别、语音合成、人机对弈等。随着分布式计算资源的增长,深度神经网络朝着网络更多、层次更深、训练算法更复杂的方向发展,复杂特征的提取能力更强。我们下一步将关注和研究如何将深度学习应用于智能工单处理并取得更好效果。主要研究工作包括扩展训练数据集、确定技术框架选型、调整神经网络参数值以及解决训练中的优化问题。

        为顺应智慧银行的发展潮流,将来还可以开展人工智能技术在更多银行领域的应用和研究,为业务部门提供更多有价值的信息。比如,在海量金融业务交易记录中进行数据挖掘,自动发现模式,实现交易风险识别、客户价值分析以及授信决策支撑等功能。人工智能技术在银行领域的应用,将促进应用系统维护工作智能化转型,推动商业银行的产品和服务竞争力迈上新台阶。

(文章来源:中国金融电脑杂志) 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多