分享

100毫秒能干什么?我们眨次眼,蚂蚁金服完成了一次大数据风控

 昵称72020678 2020-10-20
由曦
央行观察专栏作家
在蚂蚁金服风控体系的背后,是1500名从事风险管理的专业人员,其中有三分之二的人在从事数据分析和技术研发,而与他们并肩作战的,还有2000台应用服务器和320台存储服务器,这些机器专门用于风险监测、分析和处置。
100毫秒(0.1秒)能干什么?我们眨一次眼,蚂蚁金服却完成了一次实时的风控流程。从我们登陆淘宝,到选择商品,到确认购买,再到支付的各个环节,都有蚂蚁金服的风险识别和管控操作。通常,用户一个普通操作后面的背后,会有十次以上的风险识别动作。
 
在蚂蚁金服风控体系的背后,是1500名从事风险管理的专业人员,其中有三分之二的人在从事数据分析和技术研发,而与他们并肩作战的,还有2000台应用服务器和320台存储服务器,这些机器专门用于风险监测、分析和处置。
 
蚂蚁金服CEO彭蕾说,“蚂蚁金服的核心任务就是安全”。
 
CTU:交易背后的风控大脑
 
郑良西是蚂蚁金服专案风险部高级经理,这位长期在公安系统工作前公务员,一度曾经被杭州市委组织部选调挂职萧山近江街道担任副书记,在来到蚂蚁金服之后,他主要负责安全管理部下的专案风险部和情报数据中心。
 
他介绍说,蚂蚁金服的智能风控大脑取名叫CTU。它隐藏在支付宝交易的背后监控着整个网络。看过《反恐24小时》的朋友都知道,CTU在剧中叫做“美国反恐局”,是电视剧虚构的一个政府部门,将CTU作为公司智能风控大脑的名字,寄托着蚂蚁金服保护用户资金安全的良好愿望。
 
用郑良西的话说,风控体系最核心任务的是要知道“你是谁”,它需要判断账户是不是本人操作,说的专业一点,就是一个交易请求是否可信。如果CTU判断账户是用户本人操作的话,就不需要有后续的验证动作,相反,如果存有疑惑的话,CTU就会要求用户去通过验证,要是没有通过,系统就会自动阻断交易。
 
CTU通过账户与账户之间、账户与设备、账户与场景之间的行为来判断具体是否是本人操作,比如一个在网上只买衣服的人,有一天突然买了游戏点卡,这中间就可能存在风险。再比如,一个平时都在杭州的人,突然有一天半夜12点钟在广西买了东西,这中间都可能存在风险。
 
除了靠CTU在交易之中进行监测之外,蚂蚁金服的风控体系也分布在事前和事后。比如,在交易发生之前,风控体系会对账户的风险进行分层,新产品投入市场之前会有产品风险的评审、监控策略的评审和产品风险的应急预案。如果在使用了这些策略之后,还有风险发生,那么就涉及事后的风控。风控体系会调整策略,重新部署,在小时级别内作出响应,更进一步的话,还会有案件的深度分析和串并,以及和警方合作实施专案打击。
 
“我们的目标就是实现效率和风险的平衡,在这个过程中,用数据去决策、用数据来帮助业务的成长”,郑良西说。
 
大数据做业务:“用更贴近人的方式,看待一个人”
 
数据不仅可以做风控,也能判断信用并提供商业的机会。
 

盛子夏是蚂蚁金服主导成立的浙江网商银行风控总监。他于2012年加入蚂蚁金服,在此之前,他在美国discover financial services公司工作,这是一家专注于做零售信用风险管理的金融机构。

来蚂蚁金服的这几年,盛子夏对于大数据做风控和运营有了更深的体会。在他看来,要想真正让大数据要产生价值,光靠原始数据还不行,在从数据到业务的过程中,中间还有很长的链路。

 
目前,阿里和蚂蚁金服的原始数据主要包括大量交易数据、CRM客户信息管理系统的数据,还有一些外部的数据,但是单靠这些最底层的数据,并不能支撑最上面的业务平台。这就有点像采矿,如果把原始数据比喻成铁矿石原材料的话,那么最后的数据业务就好比是由铁矿石冶炼而来的钢材,从铁矿石到钢材,还需要复杂的冶炼技术。
 
盛子夏分析了数据的“掘金过程”。在原始数据之上还要有一个中间层的数据转化,这需要做大量的数据汇总,比如要把主题数据、地址库、商品库等等信息做一个分门别类,有了类别之后,还需要再去做一个基于数据中间层的衍生指标,这才能为后来的模型分析奠定基础。比如,你光有某个用户在过去的几个月里的交易数据还不行,如果还能他完成交易笔数的统计汇总就更好。类似这样的指标,才能被模型所用。
 
盛子夏说,平时提到信用评分也好,征信评分也好,包括大家耳熟能详的用户标签、用户画像,都在数据模型这一层面上的,但如果想要到模型这一层面,就要先有一套数据的链路,把应用数据集市那一层做好,只有做好了,才有可能去做用户标签,但即便如此,也不意味着就有了业务。
 
如果真的要做一个业务决策的话,还需要做上面一系列的配套的业务数据策略,在风险端,这些策略包括身份识别、授信准入,甚至包括风险定价,还会有贷后催收等一系列活动。在营销端,则包括客户需求分析,客户获取、促销、优惠、流失、挽留。在安全方面会有反欺诈、反洗钱、反套现。
 
但问题还没有结束。在数据、策略、模型之上,还要有云计算来支撑。这包括两个方面,一个是要有通用的云数据决策系统。二是数据要存储在云存储平台。如果要实现几秒钟就能放贷,这样的系统就不可获缺,在这样的一套大数据应用系统建立之后,才能够真正意义上实现了规模效应。
 
这套数据运营决策体系已经在网商银行上初露锋芒。网商银行正式开业8个月以来,服务小微企业的数量突破了80万家,累计提供的信贷资金达到450亿元。这就是用数据做风控和运营的结果。
 
而盛子夏的眼光放到更远。在他看来,大数据的能力也是可以提升的。比如,看一个用户是否靠谱,可以从他的社会阶层、教育背景、家庭住址是否稳定、学历背景,履约情况等多维度去看。用的是一种更加柔性、更多维度的视角。
 
盛子夏希望,未来,蚂蚁金服的大数据风控能够更贴近用人的方式,去看待一个人。
 
数据安全:公司的生命线
 
前面说了那么多,细心的读者可能发现,蚂蚁金服是靠数据在做风控和运营,大数据能力已经成为了这家互联网企业的核心竞争力。蚂蚁金服信息安全部高级专家王心刚说,在支付宝展业的过程中,沉淀了包括用户数据、商户数据、金融数据等各种各样的数据,而支付宝最大的责任就是保护好这些数据。
 
那么,问题来了,在网络安全堪忧、黑产盛行的今天,蚂蚁金服是如何保证数据的安全呢?
 
王心刚介绍说,首先是构建一个数据的安全体系,这个体系由三个基石组成,它们分别是,组织保障、制度流程和技术平台。先说组织保障,在蚂蚁金服公司层面,有一整套数据安全组织,分别由策略层、管理层、控制层和执行层组成,每个事业部的经理,都是部门的第一数据安全责任人。另外一个是制度流程,公司在业务的规划运行阶段,就会把数据安全风险识别出来,这样就能够将达到事半功倍的效果。第三个就是技术平台的保障,这就涉及到数据的工具,比如数据的分级工具,数据使用的审计平台数据的加密、脱敏的框架等等。
 
有了安全体系的支撑,蚂蚁金服接下来要确保的就是,在数据使用环节和流转环节,安全性都能够获得保证。
 
在数据的使用环节,所有的数据权限,都需要按需申请,并且最小授权。公司会通过一些信息安全的宣导、制度流程的发布,让所有的员工都知道,他的数据操作行为是可还原和可追溯的,因此所有数据行为必须合规,从意识层面来提高内部人员的信息安全的意识,防止内部数据的泄露以及滥用的风险。而且所有从事数据分析和开发的工作的业务人员,都是在与外界隔离的、安全的数据网络中进行的。
 
在流转层面,公司要求所有的数据要实现一个内循环。比如说,蚂蚁金服内部有A和B两个不同的业务系统,这两个系统都有业务人员在操作,如果一个业务人员想要将A系统中的数据导入的B系统,一种办法是将数据下载到本地机器,然后再上传至B业务系统,实际上数据的流转路径是存在风险的,因此,公司要求“数据不落地”,要从A业务系统直接流转到B业务系统,这样就可以在中间环节尽量减少人为的干预。
 
蚂蚁金服对于数据风险的评估和把控,已经体现在数据产生、存储、使用、传输、传播、销毁等生命周期的各个环节,为的就是把握住数据安全这条公司生命线。
 


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多