分享

中证协优秀课题 | 知识图谱在证券行业合规风控方向的应用研究——在反洗钱监测分析和集团派系识别中的探索与实践

 shenhaoyun 2023-07-07 发布于上海

中国银河证券股份有限公司

星环信息科技(上海)股份有限公司

中证协“新发展格局下中国资本市场与证券业高质量发展”优秀重点课题精编之三十

合规经营是证券公司生存发展不可逾越的底线,风控能力是证券公司把握好风险和收益平衡、确保长期健康发展的有效抓手,合规风控对于金融机构的业务风险探查和风险揭示起到重要作用。近年来我国金融机构在现代化管理体制上面临较大的合规风控压力:一方面,合规成本日益高昂;另一方面,随着违法违规行为日益复杂,原有的基于人工经验的合规系统建设已不能完全满足发现业务风险的需求。因此,探索知识图谱、图算法等技术在合规风控领域的应用,为资本市场未来合规风险管理应用场景提供更多可能具有重要意义。

一、合规风控方向的知识图谱技术

(一)合规风控的主要技术手段

合规风控工作应用的主要技术手段包括人工智能、大数据、机器流程自动化、联邦学习、知识图谱等。

1.人工智能(AI)

与传统规则互补,提升监测与报告效率,能够挖掘、发现新型洗钱模式,不断优化迭代现有模型和场景,并可保证警报优先级顺序。常用的AI模型技术包括聚类、异常监测、有监督模型、自然语言处理等。

2.大数据

开展数据治理,除结构化数据外,也可运用非结构化数据,提升合规风控领域的数据质量,完善数据管控治理,发挥非结构化数据价值。

3.机器流程自动化

即模拟人类与计算机的交互,代替人工处理复杂、烦琐以及大量的各项事务,从而大幅减少企业的人力成本,提升整体工作效率,甚至能够辅助发现工作流程中不必要的环节,实现流程优化。

4.联邦学习技术

在保护客户隐私与数据安全的前提下,联邦学习技术可实现多机构联合建模,获得更完整的监测模型。

5.知识图谱

知识图谱从关联和概率的角度出发,在描述数据背后 “真理”的基础上,模拟人的思维,智能展示分析和推理能力,这是最接近人类心中的“人工智能”。

(二)知识图谱在合规风控上的应用价值及场景

目前运用知识图谱的行业主要集中在社交网络、金融、保险、零售、广告、物流、通信、IT等领域。在合规风控领域中,知识图谱可应用于反欺诈、反洗钱、互联网授信、保险欺诈、银行欺诈等场景中,主要能实现可视化展示、关联分析、丰富特征指标、洗钱风险事中监测等功能。

一是使用图数据库存储客户信息,并借助知识图谱工具实现可视化展示,定义点、边及属性,以拖拉拽可视化形式,快速展示客户信息全貌,为监测分析人员提供灵活、直观、高效的分析工具。二是金融机构积累的碎片化数据之间存在着大量基于关系的知识,运用知识图谱,可实现实体之间的关系管理和探查,并且支持挖掘、分析未知关系,为监测人员提供知识的快速查询和挖掘、分析服务。三是知识图谱本质上是对内外部各渠道客户身份、交易信息的整合和加工,可以多层次、跨地区俯瞰、挖掘、刻画客户隐蔽性、复杂性关联关系及交易特征,用于模型构建,丰富特征指标来源,提高特征及模型质量。四是基于图分析和半监督的机器学习模型,支持主动识别客户行为和关联的异常,对具有标签的实体进行关联扩散,可以支持在开户、交易等环节进行事中干预、提前预警,将洗钱风险管控从事后向事中前置。

二、知识图谱在合规风控上的实践

(一)基于知识图谱的反洗钱监测分析

本文模拟人工分析思路,搭建可视化监测分析辅助工具,使用知识图谱建立客户直接的各类关系网络图谱,挖掘客户关联关系、刻画客户全貌。构建反洗钱知识图谱的整体思路是:首先,建立客户基础信息、委托交易关系、转账关系、社会关系等各类关系图谱;其次,基于图谱建立一些可疑客户的社区发现规则,发现一些社区团伙。

设计知识图谱,即设计知识图谱的三要素——实体、关系和属性。然后根据数据特性,分析数据和业务规律,按照构建好的知识图谱的节点、边及属性,多维度提取特征,用于后续构建图谱(见图1)。

Image

基于上述目标,设计了13类实体、16类关系,主要维度、关系及属性如下:

客户维度基本信息:基于一户通号、客户号、证券账户、资金账户、托管账户的基本信息。

客户维度和时间维度的行为信息:资金转入转出、证券委托交易及撤单、更改资料等。

身份证号维度:籍贯、出生日期、年龄等信息。

操作工具维度:手机号、IP、Mac等特征。

基于实体构建关联关系,包括一户通号-客户号,客户号-身份证号,客户号-手机号等;客户号-客户号,手机号-手机号等。

反洗钱知识图谱如图2所示。

Image

进一步基于星环Sophon KG平台(即知识图谱应用平台)可视化地构建图谱和分析图谱,以拖拉拽可视化形式,定义点、边及属性,完成知识图谱构建,快速展示客户信息全貌以及一些反洗钱犯罪团伙/关联账户或者链条的信息,辅助人工分析。

利用机器学习技术绘制知识图谱,丰富了信息来源和特征维度,为分析人员提供了灵活、直观、高效的分析工具,促进发现复杂、隐蔽、跨地区的异常行为和可疑线索,并在安全前提下打破分散作业模式下的数据壁垒,有效提高了人工分析核查效率及效果。

(二)反洗钱监测分析图谱结果验证

1.客户画像查询展示

对于目标可疑客户A,由一户通出发,可查找并展示各种属性、关联实体客户号,该客户有4个客户号,涉及多个委托手机号、多个Mac地址(见图3)。

Image

2.关联账户查探

由一户通客户A的客户号A1-A4出发,通过共用操作设备、集中交易标的等,发现多个客户之间的关联关系(见图4)。

Image

客户A与客户B预留了同一个联系电话,客户C与客户A4共用同一个手机号进行委托,客户D与客户A4共用另一个手机号进行委托。因此,由同一客户A的4个客户号,通过操作设备,可以发掘关联客户B、客户C和客户D。

3.深入挖掘洗钱团伙

使用cypher语句高级查询,挖掘上一步无法直接发现的可疑关联客户。由客户C和客户D2,可深入挖掘出关联的客户E和客户F,他们频繁地集中操作个别股票,且存在大量撤单行为。因此怀疑此团伙存在洗钱风险,可进一步核查确认。

(三)基于知识图谱的集团派系识别

随着证券公司创新业务不断涌现,母子公司业务交叉、多重授信,加之金融市场信用违约事件日益增多,主体之间因为多维的关联关系,如股权、担保、抵质押、一致行动人、夫妻等,使得风险可能在主体间存在复杂的隐形关联。本文使用了知识图谱相关技术手段构建公司同一客户认定及管理的完整解决方案,识别包含管理层、实控人、股权等关系的同一客户认证以及关联客户识别等关键问题,以此找出主体间可能存在的复杂的隐形关联,并最终应用于以信用风险管理为核心的全面风险管理中,同时可为其他风险管理场景提供支持。

1.图谱实体关系设计

从业务角度出发设计同一客户集团派系持股关系知识图谱,图谱包含三个要素,即实体、关系和属性。实体中既包括企业ID、企业名称、统一社会信用代码、注册资本等基本信息实体,也包括其股东ID、股东名称、股东类型、股东类别等这类相关性实体。关系边中则包括股东持股份额、股东持股比例、股东职务等基本关系,以便于查看相关客户企业基本信息。

2.持股关系图谱构建

基于加工好的点、边的特征宽表,在机器学习平台上以拖拉拽可视化形式定义点、边及属性,构建并固化集团派系持股关系知识蓝图(见图5)。

Image

 三、合规风控的应用研究成果

(一)反洗钱监测分析的研究成果

1.整合内外部数据,夯实监测分析基础

全面整合公司内部业务、合规、风控等系统与客户身份、资金来源、交易特征、行为特点、交易目的相关数据,结合负面舆情、证券信息、实体关系等第三方数据,丰富客户信息数据来源。

2.深入刻画客户图像,可视化辅助监测分析

使用图数据库存储客户信息,并借助知识图谱工具实现可视化展示,定义点、边及属性,以拖拉拽可视化形式,快速展示客户信息全貌,为监测分析人员提供灵活、直观、高效的分析工具。

3.探查隐蔽复杂关系,促进关联账户挖掘

在全公司范围内,跨地区、跨业务,基于客户留存身份信息、委托地址、交易信息等,探查客户、账户之间复杂、隐蔽的关联关系,促进内幕交易、操纵市场、非法利益输送、经营场外配资等犯罪行为的关联账户挖掘,充分发挥金融情报价值。

4.模拟人工分析思路,丰富监测分析特征和规则

梳理可疑交易监测分析所需的数据和信息,拓展外部数据,完善知识图谱的点、边、属性(关系)需求,并借助大数据平台海量数据整合、运算效力,设计针对性强、复杂度高的监测分析特征和规则,补充完善现有反洗钱监测预警体系。

(二)集团派系识别的研究成果

1.实现不同数据源的同一客户认定

通过整合不同数据源以及对数据的清洗和预加工,完成不同数据模块的同一客户认定,实现通过同一客户的ID信息查找即可发现其关联的所有股权关系。

2.实现全部客户企业的集团派系划分

通过运行集团派系识别算法,可根据业务逻辑的需要将所有客户划分到其所属的集团和派系,并根据底层数据每日更新的频率,保证业务人员核查名单数据的实时性和准确性。

3.实现核查企业数据的易操作性

针对包含企业数量较少的集团或者派系,业务人员直接在画布上核查分析,而对于不易在画布上查看的大集团和派系,通过一键导出功能快速导出集团或派系名单,以便业务人员核对分析。

作者简介:课题负责人:卓壮,中国银河证券股份有限公司软件工程师,负责人工智能和机器学习的智能应用;王旭昇,星环信息科技(上海)股份有限公司高级算法工程师,主要研究图算法。课题组成员包括:唐沛来,中国银河证券股份有限公司信息技术部总经理、中国证券业协会IT委员会副主任委员、中国证监会证标委技术管理首席专家;于文华,中国银河证券股份有限公司法律合规总部反洗钱团队负责人;刘永旗,中国银河证券股份有限公司信息技术部数据智能团队负责人;周诗咏、王芮、刘微、白天煜,均供职于中国银河证券股份有限公司;曾晨光、聂翠华、潘璐瑶,均供职于星环信息科技(上海)股份有限公司。

[此文为中国证券业协会2021年优秀重点课题“知识图谱在证券行业合规风控方向的应用研究——在反洗钱监测分析和集团派系识别中的探索与实践”(课题编号2021SACKT106)精选内容]

中国证券业协会

SAC_Communication

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多