分享

230110中金:信用服务市场格局清晰,数据资产估值初探

 戴维斯王朝 2023-02-09 发布于广东

图片

数据要素大时代下,金融数据的流通将走向有序,金融机构的数据资产价值将得到释放。我们认为随着征信及互联网贷款整改截止期2023年中期的临近,信用数据服务整改进入深水区,包括数据推送、盈利方式等商业模式将逐步清晰,未来可能形成持牌征信为主,助贷等其他机构为辅,隐私计算平台作为重要补充的市场格局。此外数据要素市场的蓬勃发展将有助于金融数据更加合规有序地流通,金融机构的数据资产入表将成为可能,其价值将得到进一步释放。

评论

征信整改进入深水区,信用服务未来可能以持牌征信为主,助贷等其他机构为辅的格局,行业集中度将提高。按照我们划分,金融数据服务包含资本市场及信贷市场数据两方面等,其中信贷数据服务包括人民银行、持牌征信公司、助贷类机构等机构参与。2020年后,监管政策指导个人信贷数据经持牌征信机构推送,持牌征信数据调用量大幅度增加,以百行征信为例2020年至今各个季度个人征信产品调用量均保持100%以上的同比增速。我们认为本质上金融信息服务具备较强的规模效应,在金融服务实体经济的大背景下,行业利润率或许会承压,持牌个人征信和助贷机构的市场集中度均会提高。

隐私保护技术正在与金融/政府等核心场景逐渐结合,可视作信用服务市场重要补充。隐私计算技术在2020年前已被诸多金融科技公司应用,但2020年以来随着数据安全重要性提升,该领域仍涌现了大量初创企业,下游企业也在试点应用隐私计算,也获得了资本市场关注。我们认为金融级别的隐私计算平台应用具备一定确定性,尤其是对于下游银行公共数据仍难满足其信贷数据需求,各家银行均希望可以尽量安全合规地获取外部数据。展望未来,我们推测不排除隐私计算厂商联合组建类似于大数据交易所的隐私计算平台对外提供安全合规的数据服务。

数据交易市场逐渐成熟后,数据资产入表将具备基础。金融机构作为数据的大规模拥有方,有能力存储并处理其数据资产。光大银行率先进行了数据资产估值,将数据进行分层分类,按照成本/收益/交易三种方法进行估值。结合市场发展情况,我们认为数据资产的全面估值逻辑已经清晰,但是真正全面入表仍需要时日。随着目前基于隐私计算技术的新型大数据交易生态逐步形成,我们认为数据交易市场将有望类比证券交易市场结构,使得数据资产入表门槛大幅度降低,金融机构得以释放其数字资产价值的潜力。

风险

各机构对于征信数据整改进度不及预期。

正文

信用服务市场格局初现,隐私计算逐步应用

信用服务市场变革进行中

持牌经营与新技术的应用是信用服务市场上正在发生的重要变革。我们将金融机构数据服务市场初步划分为资本市场数据服务和信贷市场数据服务,后者被我们称之为信用服务。以2020年为伊始,《个人信息保护法》、《征信业务管理办法》、《数据安全法》等政策出台,指导了个人信贷数据经持牌征信机构推送。此前,部分信贷数据服务公司的会通过API接口直接将数据发送至多家信贷数据的使用方,这种“数据出域”的多方数据合作方式并未将数据进行加密,因此实质上造成了数据隐私的泄露。而在监管后,以2023年6月为过渡期终止,我们认为信贷数据市场将结合持牌经营的要求和新技术的应用,可能呈现出三种商业模式:

企业通过收购或者合作获取数据源。通过获得数据源企业的控制权,成为自身集团的一部分,整合到自己的数据资源之中。

官方公开数据平台:政府、行业协会等官方机构会将部分公共数据对外公开,通过申请的个人或企业均可以调用使用。

公共征信获取合规的征信数据。通过公共征信平台,金融机构可以调用个人征信数据进行后续的信贷风控流程。

 “可用不可见”的方式,通过新兴的隐私计算手段获取。通过新兴的隐私计算手段,可以使得数据不出域,或者出域不可见的方式完成交互。

图表1:信用服务市场产业链包括资本市场数据服务和信贷市场数据服务

图片

资料来源:人民银行,银保监会,公司公告,中金公司研究部

非央行的公共征信平台数据调用量大幅度提升,监管正在落地中。我们关注到自征信监管整改以来,公共征信平台的数据调用量出现了大幅度的提升。我国的征信历史起源于1988年,最先以企业征信作为征信行业的开端,随后1999年个人征信业务开启,2013年出台了征信业核心的监管文件《征信业管理条例》,而2015年才开始了与市场化机构合作设立公共征信机构。央行征信的调用量、接入客户数自2013年《征信业管理条例》出台后开始了快速增长,2014-2019年均保持了30%左右的同比增速,同时覆盖的自然人口数量已经接近中国全部劳动人口。虽然央行征信覆盖的自然人较多,有相当部分人群缺乏足够的征信记录,数据维度并不丰富,因此征信的需求方对于非央行的征信数据,尤其是替代性数据有着较大需求,市场化的征信机构和具备丰富线上场景数据的互联网机构具备其存在意义。在2021年新的征信业务整改办法出台后,我们关注到与市场化机构合作设立公共征信机构,如百行征信等,其调用量和接入客户数呈现出跨越式增长的态势,百行征信的个人征信调用量在2021年5月和2022年5月分别同比增长636%/556%,面向企业尤其是小微企业的征信产品调用量增长速度快于个人征信产品,体现出监管逐步落地的过程。

图表2:持牌征信机构成立时间梳理,2023年6月是征信与商业银行互联网贷款重要的时间节点

图片

资料来源:人民银行,银保监会,公司官网,中金公司研究部

图表3:央行个人征信接入机构在2014年有较大幅度增长,在调用次数上在2015-2020年均保持了30%-40%的同比增长速度

图片

资料来源:中国人民银行,中金公司研究部

图表4:央行征信对于自然人口的覆盖率已经接近100%,但是有信贷记录的覆盖并不多

图片

资料来源:人民银行,中金公司研究部

 注:覆盖率指的是用征信人口除以成年人口(年龄大于等于15岁)

图表5:百行征信自2018年3月成立,产品包含企业、个人及政务

图片

资料来源:百行征信官网,中金公司研究部

图表6:百行征信纳入的个人征信主体2019年后迅速增长

图片

资料来源:百行征信官网,中金公司研究部

图表7:百行征信所有的产品调用量自2021年以来快速增张

图片

资料来源:百行征信官网,中金公司研究部

图表8:百行征信的企业端收录主体数量快速增长

图片

资料来源:百行征信官网,中金公司研究部

图表9:美国三大征信机构市场份额,三大征信局占主要地位

图片

资料来源:U.S. Census Bureau,中金公司研究部

图表10:美国个人征信机构集中度较高

图片

资料来源:U.S. Census Bureau,中金公司研究部

根据我们的测算,C端收费的个人征信业务每年的营业收入应当在百亿元级别。美国三大个人征信局在美国地区的营业额根据2017年美国统计局的数据,占到美国所有个人征信局的约60%的市场份额,根据我们对于三大征信局在美国地区面向C端收费的业务的营业额的占比估算,2021年美国地区C端收费个人征信直接收入可以达到33亿美元。对应的,该收入占2021年美国包含地产的家庭居民负债总额为0.02%左右。对应到国内的情况,采用与美国相同的包含地产但不包含个人经营性贷款的消费贷款口径作为基数,假设与美国具有相同的C端收费个人征信直接收入占贷款余额的比例,可以得到2022年的C端收费个人征信直接收入接近百亿元左右。我们认为随着消费贷余额和消费贷渗透率的提高,该直接收入有望不断增长。

图表11:信用服务市场我们的市场份额估算,目前C端收费的个人征信业务接近百亿元级别

图片

资料来源:公司公告,美联储,中金公司研究部 

注:标红字体为假设

金融级隐私计算逐步应用

2020年前后,隐私计算技术在国内诸多数据交易和保护的场景下进行应用。隐私计算是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术,保障数据在流通与融合过程中的“可用不可见”。隐私计算的关键技术已经很早开始发展,自20世纪70年代起,包括同态加密、多方安全计算、零知识证明等已经在学术界被归纳总结,至2010年左右已经形成了综合密码学、人工智能、计算机硬件等众多学科,形成以多方安全计算、联邦学习、可信执行环境为代表的相对成熟的隐私计算技术体系。自2010年起,国内外开始出现隐私计算的垂直应用厂商,如丹麦的Partisia,以及我国的华控清交等,国际巨头也开始纷纷布局推出商业化产品,如Intel也推出了商用的TEE产品“SGC”。隐私计算在国内的热度兴起主要源自2020年后政策端持续对于数据的安全保护进行重视,工业信息化部、人民银行、发改委等多部门先后在其政策文件中提出加强隐私计算技术的攻克和应用,其中金融业作为信息化程度较高,数据资产已经实质上作为核心资产的行业,该技术在监管端的跟进,行业间的推广都先于其他行业。

► 人民银行2019年《金融科技发展规划》提出要充分利用多方安全计算、可信计算等隐私计算技术提升金融服务的可得性、满意度与安全水平,借助隐私计算提高支付工具安全与便捷。

► 人民银行2020年发布《多方安全计算金融应用技术规范》。为国内金融业应用多方安全计算等隐私计算技术提供了官方的技术指引,目的是帮助金融企业实现在保障信息安全前提下多主体间的数据共享与融合应用。

图表12:隐私计算发展梳理,国内兴起于2016年 

图片

资料来源:交通银行《隐私计算金融应用蓝皮书》(2021年),工商银行《隐私计算推动金融业数据生态建设白皮书》(2021年),中金公司研究部

目前,隐私计算主要包含三种技术实现路径,分别为:多方安全计算(加密技术+软件)、联邦学习(AI技术+软件)、可信执行环境(硬件)三种。这其中,多方安全计算需要数据离开数据方,通过加密的方法安全私密地流转于外部平台;联邦学习不需要数据离开数据方,而是需要共有模型返回统一的模型参数,将本地数据与返回参数结合的方式;而可信执行环境更多是硬件端改造而非软件端开发。我们观察到由于芯片硬件层面我国还未能脱离国外技术的限制,因此更多的创业公司,以及隐私计算平台的建设路径是利用多方安全计算、联邦学习两种以及这两种的结合。具体而言:

 多方安全计算(Secure Multi-party Computation,MPC):图灵奖获得者姚期智于1982 年提出,是指在无可信第三方的情况下,多个参与方共同计算一个目标函数,保证每一方仅获取自己的计算结果,无法通过计算中的交互数据推测出其他任意一方的输入数据。

 联邦学习(Federated Learning,FL):联邦学习是实现在本地原始数据不出库的情况下, 通过对中间加密数据的流通与处理来完成多方联合的机器学习训练。根据参与计算的数据在数据方之间分布的情况不同,可分为横向/纵向/联邦迁移学习。

► 可信执行环境(Trusted Execution Environment,TEE):通过软硬件方法在中央处理器中构建一个安全的区域,保证其内部加载的程序和数据在机密性和完整性上得到保护,提供比普通操作系统更高级别的安全性以及比安全元件更多的功能。

图表13:浅析隐私计算三种主要的技术路线 

图片

资料来源:中国信息通信研究院《隐私计算白皮书》(2021年)

金融级隐私计算的应用仍处早期,目前大型金融机构主要采用两种商业模式:隐私计算联盟和自建隐私计算平台。根据我们的调研,大型金融机构应用隐私计算技术进行数据交互仍处于早期试点阶段,在部分业务上进行试点。我们认为目前金融机构应用该技术主要有两种商业模式:

► 通过官方协会等公共隐私计算平台合规地获取多方数据。诸如大数据交易所、互联网金融协会等官方的行业协会或者公共组织会与隐私计算厂商共同搭建公共的隐私计算平台,大型金融机构可以作为数据参与方和数据使用方接入到公共的隐私计算平台中去。在这种模式下,隐私计算厂商可以收取前期的系统建设费用和运营过程中的数据调用费用。

► 大型金融机构自建隐私计算平台。大型金融机构都会自建隐私计算平台,从而实现多方数据方通过该隐私计算平台与金融机构完成共享。在这种模式下,隐私计算厂商可以收取前期的系统建设费用,但是后期的运营可能更多由金融机构自行控制。

根据我们的调研,金融级别隐私计算的应用具备一定确定性。我们对于金融级隐私计算各参与方进行了调研,发现:1)下游银行需求确定,公共数据仍难满足其信贷数据需求,各家银行均希望可以尽量安全合规地获取政务/金融同业/非金融企业的数据,倾向于通过公共或者自建的隐私计算平台合规地获取数据;2)各初创公司目前仍处于与金融场景结合初期,商业模式包括平台建设与联合运营等,技术路线上更多采用MPC和联合建模,但是TEE与芯片的绑定较高安全性降低因此减少被采用,目前在时延和算力等核心技术问题上完全可以满足当下需求。3)信用服务市场中,持牌征信牌照优势明显,助贷机构更多与之开展合作,隐私计算仅作补充手段。展望未来,我们推测不排除隐私计算厂商联合组建类似于大数据交易所的隐私计算平台对外提供安全合规的数据服务。

图表14:目前隐私计算厂商与金融机构结合的方式,包括自建与官方平台两种

图片

资料来源:交通银行《隐私计算金融应用蓝皮书》(2021年),工商银行《隐私计算推动金融业数据生态建设白皮书》(2021年),中金公司研究部

大型银行积极地进行隐私计算相关领域布局。目前诸多大型银行正在积极地布局隐私计算领域,包括工商银行、交通银行在内已经发布了白皮书,并披露了各自在金融场景与隐私计算结合的情况。我们观察到隐私计算与金融场景的结合涉及到方方面面,仅已有的案例就包括贷款中贷前审批联合建模、贷中多方数据检测、多场景联合营销,所涉及的金融领域包括银行信贷、信用卡,理财投资和保险。

► 联合营销应用。以工行为例,工银安盛作为工商银行子公司,与母公司均为独立法人,二者数据相互独立、相互隔离。工银安盛健康险主要通过自销、银保通两个渠道销售,自销渠道的客群平均资产远低于银保通渠道客户平均资产。工商银行利用联邦学习技术,安全融合工商银行、工银安盛数据进行联合建模,构建了健康险潜在客户挖掘方案。方案立足工银安盛侧数据特征,从工商银行长尾客群中挖掘保险意向客户,并推荐至工银安盛,实现保险自销渠道精准营销。

► 贷前审批。交通银行惠民贷款(“惠民贷”)是交通银行为工薪阶层推出的个人信用贷款服务,全线上审批。为解决贷前审批信息不足的问题,交通银行海南分行与海南省大数据管理局达成战略合作,双方各自部署多方安全节点,双方节点通过专线连接。应用多方安全计算平台,交通银行海南分行有效利用公积金、社保等政务数据的价值。

► 贷中监控。为应用多维数据提高贷款风险监测水平、加强贷中风险预警,工商银行北京分行采用联邦学习技术,安全融合外部不动产数据,提升贷中预警监测模型的风险识别能力,实时监测客户信用风险。

图表15:部分银行应用隐私计算技术服务金融场景的案例举例

图片

资料来源:交通银行《隐私计算金融应用蓝皮书》(2021年),工商银行《隐私计算推动金融业数据生态建设白皮书》(2021年),中金公司研究部

数据要素新机遇,数据资产估值初探

政策逐渐清晰,数据资产入表只待模式成熟

政策端,数据确权、流通、交易的路线已经逐步清晰。自2020年起,关于数据要素的重要意见指导主要有三部:1)第一部是2020年中共中央、国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》。该意见中,首次数据作为与土地、劳动力、资本、技术并列的生产要素,要求“加快培育数据要素市场”。2)第二部是2021年1月,国务院发布的《要素市场化配置综合改革试点总体方案》,意见中要求推进公共数据共享、保护,建立交易规则,拓展应用场景。本次试点方案着重强调了探索“原始数据不出域、数据可用不可见”的交易范式,即多方计算、联邦学习等隐私计算技术的应用。3)第三部是12月19日国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》,该意见也被称之为“数据二十条”,对于数据产权划分,以大数据交易所/数商/第三方服务商为核心的大数据交易机制,数据收益所对应的分配制度这三个环节进行了非常详细的规划(详见《数据“二十条”后,金融数据流通走向有序》)。

此外,对于数据资产入表,财政部于2022年12月发布征求《企业数据资源相关会计处理暂行规定(征求意见稿)》意见函。《企业数据资源相关会计处理暂行规定(征求意见稿)》中对于一般企业的数据资产入表有着明确的定义:

 企业内部使用的数据资源,应当根据会计准则规定的定义和确认条件的,确认为无形资产。

 企业对外交易的数据资源,如果符合日常活动中持有、最终目的用于出售,应确认为存货。

新兴技术帮助实现数据高保护下流通,数据资产入表只待交易模式成型。结合政策脉络梳理和市场情况,我们认为自2020年首提数据要素以来,政策对于数据要素流通的路径规划已经清晰,包含数据确权、数据流通、数据收益分类三个环节。其中数据的确权在各国法律实践中仍然没有很好的解决数据创造方与数据经营方的权利关系,但是在新的隐私计算技术帮助下,通过数据加密或者数据不出域的方式,数据的流通有望部分规避确权的限制实现高度隐私保护下的数据流通,使得后续的数据资产的估值的基础成为了可能。未来当数据交易流通便捷规范后,我们认为数据交易市场有望类比金融市场交易模式,大数据交易所类比资本市场证券交易所,数商类比证券交易所中的券商,而第三方服务商类比资本市场中的服务商如评级机构等,而在有序的交易模式形成之后,数据资产的入表将具备扎实的计量基础,数据资产也将真正意义上成为一般企业的重要资产。

图表16:数据要素及数据估值的重要时间节点统计,2022年12月出台的“数据二十条”描绘了更加清晰的数据交易的商业化蓝图

图片

资料来源:国务院,财政部,公司公告,中金公司研究部

图表17:我们认为未来的数据流通范式将由三部分构成,包括公开数据流通、数据交易和1v1数据交互

图片

资料来源:国务院,财政部,公司公告,中金公司研究部

图表18:我们认为未来的数据流通模式将有望类比资本市场的交易模式

图片

资料来源:国务院,财政部,公司公告,中金公司研究部

以光大银行数据资产估值案例为例,目前数据资产估值包括成本法、收益法、市场法三种。2021年1月,德勤管理咨询与中国光大银行股份有限公司在北京光大中心召开《商业银行数据资产估值白皮书》联合发布会。《白皮书》以光大银行为研究对象,针对17个估值对象确定了17个数学计算公式,结合111个计算参数,明确出198个计算指标及口径。光大银行首先将数据分为原始类、应用类、过程类三种资产:

► 原始类数据:包含内部采集和外部获取,内部采集指的是公司内部产生的数据,外部获取指的是公司通过购买等方式得到的数据;

► 过程类数据:即在数据融合过程中产生的数据;

► 应用类数据:包括收益提升类和统计支持类,收益提升可以直接带来业务收益,统计支持类将间接产生数据收益。

在进行了数据划分之后,光大银行采用了三种方法,成本法、收益法、市场法进行估值:

► 成本法:通过重新制造数据资产的成本加上合理利润并减去贬值得到数据价值。将成本拆分为数据获取历史成本和数据管理历史成本,前者包括采集人员成本、采集终端设备成本、采集系统成本,后者包括内部采集类数据管理人员成本、内部采集类数据管理系统成本。

► 收益法:估计未来数据资产产生的业务收益,并考虑资金的时间价值,将各期收益加总获得数据价值。具体到光大银行的案例中,光大银行将使用数据及数据模型后的贷款损失的减少所带来的潜在贷款收益进行折现,最终得到使用数据及数据模型后为银行带来的实际收益,作为数据资产的价值。

► 市场法:根据市场已有数据交易价格,以数据特征的差异作为修正评估数据价值。这一方法使用数据交易的市场价格进行加总,需要完善的数据交易市场作为支撑,因此实际大规模使用仍然需要时间。

我们认为当下数据资产的估值方法已经清晰,成本法更加适用于一般性企业,收益法需要根据企业的实际情况选择何时的估算对象,而市场交易法需要等待数据交易市场成熟但是三种方法中估算速度最快的方法。结合市场实际发展情况,我们认为数据资产的全面估值仍需要时日,但是确定性较强,尤其是对于估值最为便捷的市场交易法,目前新型大数据交易所为核心的数据市场交易体系正在逐步形成。

图表19:光大银行对于数据资产的划分。包括三大类五小类

图片

资料来源:光大银行《数据资产价值计算研究与实践》(2022年),中金公司研究部

图表20:根据光大银行的案例,市场交易法更加适用于所有情况的估值,需要等待大数据交易市场的建立

图片

资料来源:光大银行《数据资产价值计算研究与实践》(2022年),中金公司研究部

数据交易市场此前经历了2014-2017年的初次发展,但是效果欠佳。据中国信息通信研究院发布的《大数据白皮书》(2021年12月)统计,仅在2014-2017年间,国内就先后成立了23家由地方政府发起、指导或批准成立的数据交易机构,其中以贵州的贵阳大数据交易所最为知名。2014-2017年间建立的各地数据交易机构运营发展始终未达到预期效果,我们认为原因在于:

 彼时由于数据交易机制的不完善,数据的大规模持有方如互联网机构等存在各自的独立的数据交易市场,因此并不会选择大数据交易所作为交易;

 数据交易生态并未建立,仅限于单纯的数据交易,并且数据交易没有合适的数据隐私保护机制,保护严重不足。

新兴技术一定程度上帮助解决数据确权难题,新型大数据交易所正在商业化落地。结合中金研究院在《基于公共资源论的平台数据确权探讨》中的观点,数据确权存在悖论——即数据本身的价值优势在于低成本大规模复制,但数据的确权一定程度上降低了低成本大规模复制的属性。参考各国情况,不同的法律体系给出了不同的数据确权的方式,例如采用与我国一致的大陆法系的欧洲采用“人权至上”的数据确权监管思路,一定程度上牺牲了数据的经济价值换取个人数据隐私保护。而以北京大数据交易所和上海大数据交易所的新型交易所采用基于隐私计算的技术平台,一定程度上规避了数据的确权问题。例如北京大数据交易所采用:1)上架产品有凭证。利用IDeX系统,联合北京数字经济中介服务体系,对用户上架的产品进行数据资产登记并颁发数字资产凭证,对上架产品的内容以及凭证流转过程中的所有数据进行存证监管。2)交易有明确的收益机制。制定进场交易特殊权益政策,交易参与方可根据实际成交量获取相应比例的数据权益,用于抵扣其后续通过平台购买数据、算力、算法服务时发生的费用。3)交易记录有留痕。通过区块链技术对交易记录存证上链,实现对数据资产的记录和追踪,确保可追溯、防篡改。

图表21:与2015年左右建立的大数据交易所模式不同,现在的新型大数据交易所规避了数据产权的问题所带来的商业化难题

图片

资料来源:公司官网,中金公司研究部

文章来源

本文摘自:2023年1月5日已经发布的《信用服务市场格局清晰,数据资产估值初探》

联系人:刘砺寒  SAC 执证编号:S0080121110083

分析员:张帅帅  SAC 执证编号:S0080516060001 SFC CE Ref:BHQ055

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多