【大数据挖掘】论对公大数据内评的可行性

bbpp08 2018-02-27

展开全文

“以财务指标为基础的传统内评模型已经在银行得到多年的广泛应用并已经成熟，但大数据的内评模型是否可行还在银行业以及其他金融机构中进行广泛探讨，没有一家银行目前应用了大数据内评的方式。”

不知道大家还记不记得之前的一篇《论大中型客户数字化授信的可行性》，这篇就算是上一篇的前传吧，因为一般而言都是先评级后授信。

对公客户的评级模型在很多银行都被客户经理和评审经理当成是客户准入及应付监管的工具，在业务应用中授信申请人只要符合准入标准，就不再关心；如果不符合准入标准，客户经理则会动手脚，例如改变企业规模或所属行业，试图通过模型套利的方式越过准入的鸿沟。

大数据可以为内评模型贡献什么呢？

回答这个问题前，我们先看看评级模型使用者的各种吐槽吧：

财务报表粉饰，模型再准也没用，因为输入是错的

模型敞口划分太单一，没有考虑企业性质和竞争关系

重评机制缺失，客户评级评出来放一年

定性问题人为操作空间太大，主观性太强

坦白地说有一些问题不是大数据能够解决的，是需要通过制度和流程层面来规范的，而今天我们的重点是论证大数据内评的可行性，以及看看大数据能解决哪些痛点。

接下来我们一起来看看，大数据内评需要回答哪些问题：

大数据的应用特征

与内评模型的数据应用相悖

内评模型需要相对稳定和准确的变量，而大数据的应用特征是信息源全面、时效性高和敏感度强，这与内评模型的数据应用相悖。

因此，实现对公大数据内评，需要对大数据进行相应处理和差异化应用。在应用处理方面，如征信数据并不能看某个时点的单笔授信，而需要看一段时间内的融资情况；再例如交易流水不能看某个时点的交易量，而要看一段时间内的交易笔数和平均交易金额。

在差异化应用方面，不是所有的大数据变量都适合作为模型的X变量的，如舆情数据不能成为带入模型的变量，但可以作为模型限定调整因素。

模型敞口是否可以有多维度划分方式

在传统内评模型中，模型敞口一般按照规模和行业两个维度划分，对于行业的差异一部分体现在模型敞口上，一部分体现在标准值上。

大数据内评可以在传统划分方法上，按照数据的可获取性进行创新，例如在重工业小型模型中，可获取税务数据的为一类，尚不能获取的为另一类，在可获取税务数据的一类中，就可将销项、进项、增值税和营业税等数据带入模型。

当然也可以尝试结合所有制性质、垄断/非垄断、审计/未经审计等维度划分敞口，但同时还需考虑样本量和违约样本问题，过少的样本无法建模只能采用打分卡的方式，与大数据的初衷又相悖。

大数据模型怎么应用

跟传统内评模型是什么关系

目前据我们了解还没有一家银行在评级中应用大数据内评模型（在此我们的定义是应用财务报表、客户基本信息、主观评价信息意外的数据，且不再仅仅采用逻辑回归模型建模），所以从应用的角度也不存在领先实践。

我们设想大数据内评模型有三种应用模式，一是作为调整模型在后台黑箱运营，二是将大数据模型中表现好的变量以子模型的方式带入传统内评模型中，三是将大数据模型构建成母子模型，将子模型的输出作为传统内评模型触发重评的条件。

我们再回顾一下业务人员对评级模型的痛点，大数据内评模型可以通过外部数据校验、数据间勾稽关系、尝试新的机器学习模型等方式在一定程度上解决。大数据内评理论上是可行的，但数据质量、历史数据的长度、好坏样本量等都将成为建模的挑战。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： bbpp08 > 《大数据》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

bbpp08

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换