分享

熊昊 - AI与金融:能与不能

 峥波 2017-12-15


作者介绍:

熊昊,阡寻科技执行董事,总经理。香港大学计算机系博士。曾任上海证券交易所资本市场研究所博士后研究员,研究领域为互联网证券与金融大数据,国内早期互联网证券领域研究人员之一,主持包括证券国际化在内的多个证券系统重点研究项目。


12月13日,安信证券2018年度投资策略会在深圳香格里拉大酒店隆重举行,我司执行董事兼总经理熊昊博士受邀在策略会的人工智能专场发表主题为《AI与金融:能与不能》的演讲,以下为其致辞摘要。



熊昊博士表示,在与券商资管私募交流下来发现,大家对人工智能是什么,人工智能能够解决什么,我们怎么去利用人工智能去解决问题,大家存在着身份认识上的分歧。演讲中,熊昊博士给大家分享了阡寻科技在实践中的一些想法思考和应用。

 

随着这几年深度学习技术的迅速发展,大家会把这个人工智能自然而然的去等同于深度学习技术,但实际上深度学习只是机器学习这个技术的一个分支,而机器学习又是在人工智能技术领域的一个分支,深度学习并不能代表人工智能的全部。现在市场上一谈到这个人工智能马上就反应过来去用深度学习,很多人把这两个问题等同起来,但是实际上人工智能和金融的结合不等于深度学习这个技术和金融的结合。深度学习这个概念在上个世纪就已经提出,提出以后之所以没有得到发展的一个原因是它的数据量不够丰富和计算能力不算强大。但在本世纪开始随着海量的数据上网,随着摩尔定理发挥功效,我们掌握了计算能力,数据水平越来越强大,深度学习开始渐渐的发挥了它的作用。深度学习是通过海量数据输入,通过强大的计算能力去计算出相应结果的一个过程。这个方法已经在很多的领域应用,尤其是在图像识别领域取得了巨大的成功。




随着多年的实践下来,我们发现深度学习的方法也存在的一些缺陷,包括近期的NIPS国际顶尖会议上提到的一个缺陷就是在于深度学习的不可解释性,就从输入到输出得出结论的过程是不可解释的,连调试调节的过程也是不可解释的。所以在金融这种偏严谨而且需要一种确定性逻辑的场景中,深度学习并不能解决所有这样的问题。那AI应该去解决一些什么问题?应该解决是what why和how。目前人们所采用的AI算法深度学习是黑箱,只解决了人类层面的what的问题,但是对机器层面的what和why的问题基本上是无能为力的。现在文本分析领域最常见的就是通过机器做自动化的翻译,不论是翻译结果还是翻译过程都并不会被机器所理解。泰国发洪水的新闻会给整个市场带来什么样的影响,以及他的影响因素是什么问题,现在这个深度学习黑盒算法是无能为力解决的。解决这个问题,需要通过去点亮这个知识图谱或者智能推理这个科技树。阡寻在实践中已经做基本做到了能够去解决why和how级别的一些这种问题。

 


人类和机器交互在信息接收和信息理解。在信息接收端里,图像识别和语音识别技术开始成熟,我们已经慢慢的可以把物理世界的东西电子化到虚拟世界中,那么AI之后要攻克在信息理解端。在金融领域的应用,我们不可能只是接收资讯,我们在金融领域中更加需要攻克理解的问题,需要加以应用AI手段对资讯进行理解。我们主要是从词法、句法、语法上的语义理解去解决信息理解端的问题,把资讯从物理世界采集到虚拟世界,在金融领域会更有价值。在推进语义理解解决信息理解端的问题和信息接收端的图像识别语音识别等所需要的科技树并不一样,这意味着不论是金融机构还是科技机构在这个过程是存在着弯道超车的机会。所谓的语义理解,就是我们要理解这段话里的零散的字词段其所表达的意思。但是通过市面上一些深度学习类似的方法很难去做到这一点。因此阡寻采取了第二个科技树 - 知识图谱,把知识图谱的技术引入来解决金融领域语义理解的问题。


知识图谱的技术是谷歌公司于2012年提出的一个技术。包括实体知识图谱和事理知识图谱,实体知识图谱说明的是实体之间的关联关系,事理知识图谱说明的是事件之间的关联关系。通过知识图谱在后台做支撑,可以让整个数据活起来,让整个数据深入到语义理解的阶段。现在市场上基本所有机构都在做知识图谱,大部分是上市公司或者非上市公司股权关系的知识图谱,通过知识图谱之间发现潜在的关系,或者实际控制人共同的信息。第二种知识图谱,是通过我们之前的积累,将上市公司常用的、常见的行为以及这个行为会导致哪个常见的行为出现,用知识图谱进行推理的事件集的知识图谱,叫做事理知识图谱,它可以对一个事件发生是否会导致另外一个事件必然发生以及怎么发生做一个图谱化,让我们不但知道事件发生,还能够去指导事件发生的影响,能达到回答why或者how这样的问题。第三个知识图谱是我们自己建的,把上市公司之间的主营业务产品之间的上下游关系通过知识图谱表征出来。这有助于我们解决why或者how这个问题。举个例子,中汽协发布了汽车6月份销量上涨,在语义理解上,最多能理解到把非结构化的文本解读成结构化的文本,但是很难用机器自动化推理出这个事件对整个市场的上下游产品的意义,那么通过产业链级别的知识图谱,可以做到这一点,新能源汽车上涨会对哪一些公司和哪一些产业产生影响,这整个过程全部是由机器去自动完成的,没有经过人工的干预。这是属于知识图谱的科技树而不是深度学习的科技树,我们点知识图谱这个科技树,期待达到解决传统上不能解决的why和how级别的问题,那么这是AI发展的一个现状。

 


那么AI与金融的能与不能在哪呢?在经过各种交流,熊总有以下总结:

 

不能的东西是什么?其实这里说了很多,抽象来看什么东西是AI现在无法解决的呢,第一,缺乏数据的:神算黑天鹅和无“数”之炊是典型的缺乏数据,AI无法去解决这些问题。无论是你点亮的是哪一个科技树,AI都是需要数据去培育的,第二,缺乏计算能力的模糊思维和情感关怀是无法去解决的。



先举个例子,什么叫神算黑天鹅?现在从市场上的一些宣传和金融机构对我们提出的一些需求来看,有一些会让我们试图去预测出市场的一些黑天鹅事件,我认为这是AI在短时间内无法达到了。黑天鹅为什么叫黑天鹅?就是因为它在历史上发生的次数很少,缺乏充足的数据去推测。AI在缺乏数据的情况下,怎么能够去把这些事情预测好呢?这是一个不现实的事情。比如说一件从来没有发生过的事情,英国脱欧。历史上本来就没有出现过英国脱离欧盟这个事情,让AI去做这个预测,我认为这个对AI要求太高了,不现实。这种历史上没有发生过的事情的预测,我把这种需求定义为神算黑天鹅。


第二个例子叫巧妇难为无“数”之炊。AI应用在二级市场是能发挥威力的,因为二级市场的企业是比较市场,尤其是天使轮和A轮这样的市场项目,有些机构也试图用AI的方法去解决,我个人认为是不靠谱的。因为很多资讯、很多信息都是依赖于线下去收集的。但应用在一级集的,连基础材料都没有,怎么能够说可以用AI手段去解决这些问题呢?


上面举的这两个AI不能的例子是因为缺乏数据,下面举的这两个例子是缺乏计算能力。缺乏计算能力的问题,在未来如果计算能力取得突破的情况下,我认为是可以解决的。什么叫缺乏计算能力呢?比如说人类的模糊思维,其实人类的模糊思维抽象的来看,无非就是人类走到每一个选择的时间节点的时候,都会有很多的分叉,每一个选择的分叉都是以2的次方去增长,这个对于传统计算机的计算能力是无法达到的级别。如果我们在量子计算机方面取得了突破,有可能能够让AI达到这方面的能。这是我认为AI不能的一个场景。反过来讲,AI不能的这个场景,对应AI能的场景是什么呢?很简单,就是数据丰富并且现有的计算能力可以支撑的场景。比如说基于历史预测未来,对于已经发生的事,利用AI去预测或评估一下它的影响,和再次发生的可能性,这是可以的。


我引用了圣经里面的一句话来描述AI比较擅长干的事:已有之事将来必有,已行之事将来必行,太阳底下无新事。在这种情况下AI能够发挥它的价值,因为它对历史上的这些事件已经有大量的数据去训练,得出市场对某一类事件某些事情的应对和其影响,而一旦有类似的事件归类出来,AI能很快的去找到。


第二个事件就是在茫茫数据中寻找观点,这正好应了我们公司logo里的小蝴蝶,蝴蝶效应。在海量的数据中AI能够通过一些规则,通过一些学习去找到一些看似根本就没有关联,但其实关联度很深的实体之间的一些关联,我认为在原则上来讲,AI的能与不能就是在这里。


我没有举哪个业务方向我们能够用AI去实现或者不实现,因为我认为每一个人对业务方向实现功能的理解是不一样的,我只是用一个大的原则,试图去涵盖我们能做和不能做的事情。我们在第一个部分讲完了AI的技术现状,在第二部分讲完了AI的能与不能,第三个部分我会去讲我们金融机构如何和这个AI企业去合作,怎么去拥抱AI这个技术的发展,所以第三部分叫金融与AI正确的拥抱方式。


我应该是2013年入行的,正好是伴随着互联网金融的发展,也见证了整个市场对互联网金融也好,金融科技也好的整个态度。这几年的从业经历告诉我,在市场上,我们的金融机构对AI也好,新的技术也好,基本上存在着两种比较典型而且比较偏极端的认识。第一个我们叫它高冷派,高冷派一个最常见的说法就是金融的本质是金融,任何东西都无法改变金融的本质,所以技术发展跟我没有任何关系。其实对这一派,我们的想法是技术确实不能改变金融的本质,金融本身永远不会因为其他东西而改变,但是我们可以改变实现这个本质的路径,进而重构这个业态。


第二个派别我们叫做降临派,这个名字取意自三体,他们认为技术这个三体能够决定与取代一切,金融人将无处安生,这也是我们现在看到很多新闻媒体,尤其是偏AI这种新兴媒体的报道,每天都在鼓吹AI能够取代金融的这个和那个。当然,我们如果要想金融行业和AI行业很好地去拥抱,首先必须去打破这两个心魔。会有这两个心魔,我们要回顾一下技术与业务相爱相杀的历史。


我们把这个相爱相杀的历史分成了三个阶段,第一个阶段叫做算盘加账本的阶段,技术是一个工具的时代。在这个阶段,技术手段替代了算盘账本,是金融行业进入到初步的电算化或者说信息化的一个时代,技术在这个时间节点只是辅助的工具,便利了金融,但是确实没有对业务产生直接的影响。这一个时代也是造成高冷派对技术的印象形成的直接原因。随着时代的发展,我们走到了渠道时代。在渠道时代这个阶段,互联网企业开始切入到金融行业,叫做挟流量以令诸侯,无往而不利。他们采取的打法其实很简单,野蛮人依托的就是它的流量优势,而不单纯是技术优势。以流量加标准化的金融产品的方式横扫一切,我们对他们的战术总结取自于一部著名的电视剧——《我的团长,我的团》里面的一句台词,叫做:万年不变小日本,大炮轰完步兵冲。步兵冲完大炮轰,基本上就是处于一个流量为王的阶段,用流量加简单标准化的金融产品,降临派的痛苦记忆也来自于这个时代。


随着渠道时代的结束,技术在金融行业的浮土或者浮在表面的东西挖完了以后,我们便走入了第三个阶段,这是技术人格化的阶段,AI技术开始真正的兴起,我们会在金融领域生产出各种各样不同的AI,比如说AI分析师、AI交易师、AI操盘师。在这个阶段我们面对的是一个技术和业务发展深度融合的阶段,这个阶段的特点主要表现在几个方面,一是技术将成长在业务场景而不是浮在业务场景上面,第二个是流量并不能的一切,场景的理解能力才是关键,这意味着在渠道时代,互联网企业或者技术企业包打天下的思维是不可持续的。第三个就是人工智能与区块链的新兴技术将赋能金融的一些场景。在第三个时代就是将金融和AI相拥抱的时代,这会产生的一个时间特点。那么我们如何去拥抱这样一个时代?首先要明确一个中心思想,在这个时代产品开发既不是技术人员的事情,也不是业务人员事情,而是一个相对融合的一个事情,因为这是一个融合的时代。AI和金融结合的过程中,如果抱着甲乙方的思维去做,那么会造成的结果就是技术人员没有深入到金融的本质,并没有改变金融的业务形态,也没有去提升金融真正的痛点和效率,而业务人员会不停地埋怨技术人员,并没有带来真正的价值,这种拥抱的方式不对。第二个方面我们认为要清晰定义利益,因为虽然在上一个时代—渠道时代,金融企业已经对互联网企业或者技术企业产生了很大的一个恐慌的情况。举一个例子,金融企业在合作过程中一定要定义出其最核心是什么,其实是我能给出去的,和我认为自己不能给出去的。这个可能说的比较虚,那么我举一个简单的例子,入行之初我是做信息安全出身的,我当时跟一家这种大型的机构合作,我会跟他们CEO汇报,我说您的这个系统容忍这个攻击的容忍度是多少?他说我的系统不能够容忍任何的信息安全问题存在,那我心里给他的建议是让你把这个系统关掉吧,这是一样的道理,就是我们在合作的过程中,因为它是一个融合时代,是一个知识共享的时代,我们经常会问合作方金融机构,你们能够贡献出什么样的知识或数据。因为大家被上一场战争吓怕了。


在融合时代,互联网搞定一切的时代,搞定数据。很多金融机构吓怕了,会很保守说:我不能!我不能让你知道我的任何东西,包括数据、知识、逻辑都不能让你知道,因为我要去保护。但是我们反过头来想,这真的是我们核心的竞争力吗?这真的是我们在技术和业务和发展过程中做得最好的一个平衡吗?如果我们不解决这个问题,那么我们很难去拥抱好AI时代,这是我提出来的一个问题。


最后一个部分,借这个机会来讲一下我们的实践,相当于给我们做一个小小的广告,那么我们自己开发了一个中国Kensho赋能器的概念,这是我们阡寻科技的产品线之一,那么什么叫做赋能器?我们和美国的Kensho做了一个对比,它的目的是制造出一个机器分析师替代掉华尔街,很长一段时间也一直有人质疑这个东西,我们从很多交流过程中发现,它的一个大问题是它把这个体系做封闭了,做了科技公司不应该做的事情,他试图把技术和业务都做掉,我们在吸取经验以后,我们采取了阡寻技术,阡寻基础知识,加强券商独特知识的一个基础体系,我们试图搭建的是一套Kensho的技术架构,让券商的知识,在我们的架构深度融合,打造成千人千面,一个券商一个Kensho的体系。从做一个无所不包的机器分析师到做一个机器分析师的培训学校或者机器分析师的生产器。



那么我们可以给大家看一下我们做的移动版的案例,限于今天的时间和篇幅,这只是其中功能之一。比如说,当一个事件发生时,触发推理引擎去输出对该事件能够有影响的重大关联股票产品,必须溯源相应的路径,其实就是解决我一开始提到的用知识图谱去解决why和how级别的问题,这是我们做的第一个实践工作。第二个是做产业链的知识图谱,向人们去展示整个市场的关联关系,这一套体系的建设就是按照我刚才所说的Kensho的概念和与券商合作去建立一套技术的一个体系。这是我们未来基于区块链新兴技术,想打造的一个知识共享系统,可以在这里先把PPT放出来跟大家分享一下,由于时间关系,我就不具体向大家讲述了。这是我们现在做的产品的二维码,大家感兴趣可以扫一下,我的分享就到这里,谢谢大家的时间。



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多