分享

春山多胜事,量化再起航

 新用户01098774 2023-03-17 发布于广东

图片

「引言」

“春山多胜事”,量化再起航,今年223日,在招商证券春季交流会(杭州)上,我们邀请了多家头部量化私募和业内知名机构,与各位投资者进行了丰富多彩的主题分享。受邀管理人和机构包括思勰投资、白鹭资管、诚奇资产、龙旗科技、仲阳天王星和卡方科技。我们对这些管理人的精彩发言做了纪要,与各位投资者进行分享。

此为下篇,对龙旗科技、仲阳天王星和卡方科技的嘉宾分享内容进行纪要展示。

「春意满山河,量化再起航 」

龙旗科技  朱晓康

图片

前面各位大咖已经讲了非常多精彩的东西了,我希望也利用今天这样一个机会,跟大家做一个相对比上次要简短很多,但是可能视角稍微有一点点不一样的分享。

我相信这一页PPT上面的数字,大家只要是关注量化行业都会非常熟悉,我们是取之于基金业协会的数据统计,在2017年当时整个归属于量化的基金管理规模只有1,100万左右,基金只数其实并不少,大约有3000只左右,但是在短短的4年之后,到了2021年,整个量化基金的规模超过了1万亿,只数也达到了将近17,000支量化基金。

图片

所以在2021年确确实实是整个量化行业一个爆发式的增长,那么随着整个行业爆发式的增长,对应于我们量化管理人总体的超额业绩情况是什么样的?

我们在这一页做了一个非常简短的分析,是取自于一个公众号上面的,他们平常所跟踪的量化行业的大几十家的管理人,我们在计算超额的时候是取了每一家管理人那一年的产品表现除以指数表现,用除法来计算这样一个平均数,然后取了有完整4年期业绩的20家管理人,基本上代表了市场战略和行业最优秀的一批管理人。

图片

从这个上面看,首先超额还是非常优秀的,特别是在2019年和2020年,大家可以看到这20家在行业里面非常有代表性的管理人的平均超额收益,这个是以500指增产品的超额收益为计算标的,19年大约是在20.6%20年是22%,所以大约是21%的一个水平。

但是非常有趣的是,如果我们用同样的方法去看整个行业在2021年和2022年的超额,大家非常明显地可以看到,整体的超额水平基本上是接近于腰斩的情况,下降到了只有12.8%12%左右的水平,虽然还是非常优秀的,因为前面特别聊到跟主观的很多管理人相比,其实在最近两年超额的情况还是相对不错的,但是相对量化行业前两年自身的超额水平,确确实实是有一个比较大的跌幅。

那么这也是很多投资者问的一个问题,量化行业的一波红利是否过去了,业绩的持续性是否还有一定的保障?

为了回答这个问题,我们回到一个在量化行业非常经典的公式,叫做Fundamental law of active portfolio management,它的出处是一本很经典的书,叫Active Portfolio Management,主动投资组合管理,这本书的两个作者也是在量化行业里面非常资深的两个元老,Richard C. GrinoldRonald N. Kahn,这个是我以前在美国工作的时候,我们研究部的两位最资深的老大。他们在这本书里面提出了这样一个非常经典的公式,简单来说的话,IR是代表信息比率,等于IC乘以所谓的“广度”开根号这么一个非常简单,但是非常经典的类似于牛顿三定律的基本公式。

图片

如何来理解这样一个公式,简单来说的话,一个管理人业绩的表现大致等于他的选股能力水平的高低,performance等于skill乘以所谓的breadth开根号,也就是说你的选股可以得到的所谓的相对独立的选股的数量也好,或者是take independent breadth的数量大概有多少,大概是符合这么一个非常简单的关系。

站在今天,我觉得从我们量化行业的角度,如果我们希望提高我们策略的表现,还是要回到这样一个基本的公式,我们分别能够在 skill上和我们策略的广度上做一些什么样的事情,特别是站在今天这样的市场的时点,行业发展的时点,我们应该相对比较乐观,还是比较悲观呢?

从龙旗自身的实践来说,如果回到这样一个非常基本的理念的话,我们个人相对觉得还是比较乐观的一个情况,为什么?

图片

首先从外部的因素回到广度而言,最近一两周大家也都知道,注册制其实是以超出我们市场所预期的速度在往前推进。实际上注册制的试点开启以来,A股的上市公司数量已经由3500家,增加到今天超过5000家。如果在主板也开始推行注册制,大概率很快会上升到6000甚至7000家上市公司,在这样一个大的市场背景和环境下,联系到前面这样的一个基本的公式,我觉得它实际上是非常有利于我们量化去发挥我们的特长,因为它在选股的广度上具有非常天然的优势。所以更多的可以交易的股票只数,也可以给我们带来更多的一些交易型的机会。所以说回到前面基本的定义的话,我们觉得首先在breadth上面,其实在目前随着注册制的全面推进,反而应该更加乐观。

另外一点,今天前面有的嘉宾老师也提到,可能很多做主观的对今年的市场相对更乐观,如果今年的Beta更好,那么对于我们策略表现会有什么样的影响,特别是对于IC会不会也有一些影响。基于前面我们提到的行业的数据的简单分析,也就是回到前面提到的有完整4年业绩的20家管理人,我们结合市场本身涨跌的情况,看了在不同的市场涨或者跌的时候,整体的量化行业的超额是不是有不一样的表现。

图片

这个结果也非常有趣,我们可以看到上面一行是代表了在过去三年市场上涨的时候超额周度平均的表现,下面是在市场下跌的时候,周度的20家管理人的超额情况。

非常有趣的是,在2020年市场上涨和下跌的时候,超额大致相似,周度超额差不多是0.44%0.46%,但是在过去两年其实是发生了一些变化,首先我们前面提到的超额有一些下降的趋势,但是另外一个非常有趣的点是说,当市场下跌的时候,超额似乎更难赚取,比如说以2021年为例,在市场下跌的时候,这些顶级量化管理人周度的平均超额只有0.22%,相比2020年的时候,是从0.46%下跌到只有0.22%,这个跌幅可能是超过一半的,当然在市场上涨的时候也有一些下降,但是下降的相对幅度要少一些。因为大家普遍预期今年市场整体的环境,市场的氛围,特别是相比去年要好很多,所以在Beta如果能够上涨修复的情况下,根据过去两年这样的规律,我们实际上对今年的IC可能也会有更多的期待。所以这个是从两个市场外部因素,我们为什么对今年整体的量化行业,整个市场更加乐观的很重要的两点考量。

与此同时,回到前面最基本的公式,全行业面临的共同挑战还是要如何去提高IC,实际在今天的在市场上,不同的管理人也在从可能的方方面面,不同的角度,在努力做各种各样的尝试。

图片

我们这边也列举了一些大家现在可能思考在做或者已经在做的一些事情了,比如说拓展信息源的深度和广度,获取更加多维度的超额。有的管理人是打造多元化的策略性和产品设计,以提升整体行业的策略容量,也是提高广度的一种方法。

前面嘉宾也提到最近机器学习的一个突破式的进展,当然是跟我们没有什么特别直接的关系,但是我觉得也让我们对未来机器学习如何在量化上更好地应用,让我们会有更多的期望。虽然在过去几年机器学习在量化行业上面已经有了广泛的应用,但是我觉得应用的方式上将来可能会有更好的突破。当然也可以在硬件的投入方面去提升整体行业的IC。这些我觉得都是非常好的方面,其实经过了短暂的两年相对低沉的表现,我个人认为今年还是非常值得期待的。

从龙旗本身的历史来说的话,我们在这个行业已经存活了11年了,非常幸运的是在经过了几轮的市场流行,行业的快速迭代之后,今天还能存在,我觉得是一个非常幸运的事情。

图片

从我们自身来说,这一路走过来本质上也是在随着行业市场的变化,监管的变化,在努力地去适应市场的环境。比如说我们从早年纯粹的基本面量化,到了1819年我们全部迭代为中频的量价选股策略,更加高换手的一些策略。站在今天我也是非常期待说我们下一代的策略的模型可能会给投资人带来更加优秀的回报。这个也是非常有趣的一张图,分享给大家,某种意义上是代表了整个行业的发展。

这个是我们回顾了龙旗自身在过去10年实盘,过去所有的策略,所有的产品加权平均,只是把它按照3005001000进行分类,相对各自指数的超额表现。

图片

这是我们去年10月份做的一个分享,非常有趣。等我同事做完这张图之后,我觉得还是非常感慨的,因为这个行业首先从过去10年发展下来,大家可以看得到,其实超额表现总体还是非常多的机会,但是这个中间走过来的路,它其实不会是一条笔直的线,它永远不会是非常平稳的,最重要的还是需要我们策略不断迭代,让我们的超额表现能够持续创出新高。

最后其实也是上次招商秋季会议来参加的时候给大家分享的一张图,我个人非常喜欢的一张图,这个是美国道琼斯指数在过去125年的走势图,当然是取了ln,否则的话这个图是呈一个抛物线的情况。

图片

这个图为什么我非常喜欢,首先它的时间足够长,第二这个其实跟前面分享的净值曲线有一些像,是一路走上来,虽然在不断创新高,但是它永远也不是一条笔直的曲线,实际上是往上的,然后在中间很多时候,可能出现长达十几年甚至二十几年的盘整。然后原图有一个非常有趣的标题,它说人类只有不断创新,才能帮助我们人类克服恐惧,它下面列了每一个时期人类最伟大的一些创新,能够让我们的社会经济不断往前进步,随之指数在不断创新高。

回到我们量化行业,我觉得也是这样的,首先还是需要整个行业拿出新的一些完全不一样的创新的方法,回到我们前面基本的公式,提高IC,提高IR,最终能够让整个行业的净值不断创新高。

我今天简短的分享就到这里,谢谢大家。

「量化策略大升级,行业发展再平衡」

仲阳天王星  孙博

图片

感谢在座的各位朋友,大家下午好,我是仲阳天王星的孙博,非常感谢招商证券的邀请,非常荣幸站在这里跟大家分享一些我个人对量化行业投资行业的感悟和从业经验。

我们这次策略会的主题叫“春山多胜事”,下半句应该是“赏玩夜忘归”,我们中国量化行业也处在生机勃勃的发展阶段,有无限的生命力和可能性,所以我今天跟大家分享的主题就是量化策略升级和行业再平衡

图片

今天分享大致三个部分,我们这个会议的标题叫做论道,所以也是讲一讲道方面的几个topic,可能讲的数比较少一点。第一部分我们讲中美量化投资发展的阶段和两个市场比较的异同。第二讲我个人认为的作为一个管理人核心的投资能力。第三个讲我们中国量化未来的发展趋势。

图片

刚才很多嘉宾也讲到了美国量化行业的一些现状,大家都比较关注美国的同行,包括行业发展的近况。其实量化行业是从国外发展起来的,传到我们中国是一个相对比较新兴的行业,在这几年有了非常大的发展,国内现在做的比较优秀的基金管理人,也都有很多海外量化基金出身的背景,启蒙工作可能都是在美国的一些大的公司或者大的团队里面完成的。所以我们看一下海外同行的发展情况。

图片

美国对冲基金行业起源比较早,它最早是1949年,Ben Graham,实际上就是巴菲特的老师成立了一个叫做Graham-Newman的基金,Alfred 也成立过AW Jones,这个可能是我们对冲基金的鼻祖,在当时投资标的包括量化对冲,收益创造的方式都比较有限。

到了80年,国际投行摩根士丹利,在我们国内称之为大摩,召集了一批数理天才,包括GarryNunzio,他们开始做配对交易,Pairs Trading,开始了我们对冲基金行业的萌芽期。

到了1980年很多对冲基金开始使用的投资策略逐渐变得丰富起来,交易的品种,市场也丰富起来。在这里边有很多使用的套利,不良债务,固定收益,包括量化和多策略的都在进行投资。在资金端很多的养老基金,pension fundendowment fund,学校的基金,机构投资人加大了对对冲基金的投资。

2000年以后对冲基金在全球就得到了快速的发展,2007年年底大概到了2万亿美金的规模,但是2008年就发生了全球的金融危机,可能在座的很多都知道,而且可能还有一些感受。

我自己也是2008年在哥大毕业,当时工作非常难找,两家最大的投行,一个是Lehman Brothers,还有Bear Stearns都倒掉了,找工作是非常的困难,所以最后也是被逼上了创业的道路。

2008年的金融危机之后,各个市场包括对冲基金都受到了极大的冲击,经过几年的修复之后,在2011年对冲基金又首次突破了2万亿美金的持续增长的一个规模。

我们常年在海外,大家一般会关注比较头部的几家基金,比如说Jim Simons他们创建的Renaissance,文艺复兴基金,这家基金可能也是量化的一个传奇,他们很多年以来都是百分之三四十这样的回报。包括去年Citadel38%的回报,为客户争取了大概160亿美金。所以即便是在美国这样非常成熟的行业,其实还是有很多的阶段性的机会,包括公司与公司之间,行业与行业之间的差异化。

图片

这是一张中美投资者构成的结构图。我们可以看到居民持股大概是在30%左右,其中A股的个人投资者持股比例也是在百分之三四十。但是从我们量化交易或者市场交易的角度来说,我们可能更关注的是交易量。

从交易量的角度来说,我们一方面以产业资本为主的大股东以及关联方应该长期是A股市场持股规模最高的投资者。如果只看专业的机构投资者的话,这个比例在美股实际上是四五成,在中国大概只有18%。另外一方面我们关注交易量的贡献,美股散户对交易量的贡献常年维持在百分之二三十以下,近百分之七八十的交易都是一些高频交易或者是机构交易所产生的,但在我们中国散户的交易比例是非常高的。从投资者结构来看,美股的投机构投资者占比比较高,外资入局也比较充分,导致竞争比较激烈。

从美国的Barclays 1971年发行第一只被动的量化投资基金,量化投资在美国作为一种被整个市场广泛接受的理财方式,距今已经有50多年时间了,从数据到因子到模型到组合到交易的各个阶段,都可能完成了不止一轮的迭代。他们对量化投资的理解和应用,比很多其他国家或其他市场的参与者都更加深刻。在美国的证券市场由于由量化驱动的交易数量达到了七八成,所以无论一家对冲基金的核心策略是不是量化,那些数据驱动程序化交易的理念和方式都或多或少得到了应用。

美国作为全球流动性最强,标的最丰富的金融市场,量化交易的标的也从股票期货蔓延到了众多的衍生品,还有一些场外的市场,激烈的竞争和迅速的迭代也让市场有效性在逐渐增加。哪怕是最顶尖的管理人,相对指数能够创造的超额收益水平也大概就是在3-5%左右。

所以横向比较来说,我觉得我们中国的同行或者量化行业确实还在一个起步萌芽的阶段,虽然纵向来看,我们的超额在整个行业上是有一定的收缩,刚才某同仁也放了一些图片,但是我觉得横向比较来说,我们还是非常幸福的。

在美国的同行可能在3-5%的超额下,大部分通过加杠杆或者其他的方式来获得一定的收益,但在我们中国的话可能还有20%30%甚至40%的超额收益的机会,我个人觉得可能是我们中国整个证券行业或者金融行业从事量化交易的一个时代性的机会。

纵观我们中国的几大类的交易标的,比如说房地产,股票,期货,中国的房地产可能有过一个10年到15年这样一个超长的红利周期,而且很多人是切身从这一波超级周期里面挣到了钱,证券行业我个人感觉有类似的这样的一个机会。10年涨10倍的话,其实只要年化收益25%。很多的管理人在不同的产品上,不管是500指增,1000指增,还是说做量化选股,或者其他对标指数的超额,其实25%的机会是完全可以创造的。

但是从持有人的角度来说,很难能够实现财富的10倍的增长,其实一大部分的原因是我们量化的产品设计流动性可能过于好,不像房地产,我们的房子可能一住住很多年,它的交易相对流动性比较低,我们量化产品的流动性还是比较好,有申赎的机制。所以从一方面也造成了刚才好几位同仁讲的,为什么基金挣钱,但是基民不挣钱的非常重要的原因。

图片

我简单的说一下我们中国量化行业的发展,在座的各位可能比我都熟悉。

分水岭大概在15年,15年之前,我们基本上有个行业的萌芽期,中国首个300股指期货的上市也出现了最早的一批量化,当时可能还有很多手工套利的机会,我们手工点点可以做一些期限套利,也可以挣一些钱,但是15年股灾之后,可能就进入了行业快速发展期的阶段,当时应该是有中证500IC和上证50IH这两个期指也在上市,我们很多的量化管理人在这个方向进行了一些很早期的尝试,也取得了一定的成就和效果,也为市场打开了一个新的方向。

21年是一个比较有标志性的节点,首先市场有一些比较好的Beta的机会,同时有巨大的超额的规模,整个市场的体量也上了一个台阶,应该是已经到了1万亿,到22年年底的时候整体规模已经到了1.5万亿。虽然说我们近两年整个行业的规模发展比较快速,但是我们从刚才一个同仁分享的 PPT上可以看到,量化行业在国外总体的规模的跟其他的方向来比的话,我们还是有很长足的空间。

图片

我们在大概21年底的时候就已经突破了万亿的规模,到22年到了接近1.5万亿了,行业占比也超过了25%

百亿量化私募越来越多出现在投资者和媒体的视野当中,量化也作为一个比较主流的投资方向,投资产品也被越来越多的机构,包括个人投资人所接受,大家也认可这样的以数据为底,以科技驱动的投资方式,个人投资者和机构投资者对量化策略的认知和参与度也比以往丰富很多,无论是机构的直投,委外还是高净值客户的购买,已经把量化基金作为一个非常重要的投资标的和投资手段,并且在投资策略包括收益分解,风险控制等等方面有一些逐步的而且更加专业的认识,而并不是早些年把量化作为一个黑盒,只是拿着最终的业绩来说话作为投资决策。所以对于整个行业来说,百花齐放的量化私募的格局,我相信肯定是各位参与者,这里面包括券商,包括私募,包括托管,所有的参与者和所有同仁共同努力,取得的一个比较良好的市场培育的成果。

图片

如果从规模,投资者结构或者波动性,量化行业本身的发展去对比中美的话,中国的量化投资还是有非常好的超额挖掘的土壤。我刚才讲其实对比美国的同仁,我们中国量化行业的从业者还是要幸福很多,虽然两地的市场结构差异非常大,不能说把美国的东西或方法照搬回国内直接用,但是我们投资的底层逻辑或者方法论是一致的,在中国的市场结构下,我觉得优秀的团队和优质的管理人能够做出很多差异化的产品,包括很多差异化的方法。

我们看一下中美两个国家的市场对比,标普的年化波动率大概是18.7%,而中证500的年化波动率是29.75%,看起来中证500要比标普要高很多,但实际上如果只看过去三年的话,中证500和标普的波动率是差不多的。当然过去三年因为疫情的影响,标普的波动率实际上比历史是偏高,大概25.3%,中证大概有21.34%,但即便是这样的情况下,我们也看到过去三年,美国的量化基金超额的实现情况也都是比较好,所以印证了我们行业大家普遍的一个认知,就是超额跟波动率是有一定的关联,当然我们还有一些其他重要的指标,我相信各位可能对整个量化行业的超额的来源或者超额收益的来源都比较关注,我觉得有几个比较重要的指标,第一成交量,第二波动率,第三个散户的参与程度,包括市场结构市场交易规则的变化。

图片

我们做个简单的小结,虽然说量化竞争现在在国内已经比较激烈,而且我们国内迭代的速度比国外的同行确实要快很多,大家也愿意在更多的方向进行创新和尝试,包括AI,包括人工智能,包括一些GPU、显卡、超算等等诸如此类的方向,包括产品的模式上。比如说我们做出指增产品,其实在美国很早以前就有,我们叫做SmartBeta,但是可能主流的投资产品还是传统的market neutral加杠杆的这种对冲基金的产品。所以无论A股的波动率还是交易规则的保护,投资者的结构,甚至对外资交易的限制,其实都是中国市场能够在一段时间内继续挖掘红利的护城河和成长的空间。

国内量化的投资发展阶段总体来说可能比美国相对滞后一些,但是我们迭代速度非常快,而且逐步在走向成熟。用大概5-8年的时间,其实已经走完了美国30年的发展历程,这也代表着我们中国量化私募行业的未来可期。

所以这里面引出一个问题就是我们中国的量化私募行业发展到今天,这么多家优秀的管理人,怎么去区分管理人之间有什么特别大的不同? 

图片

首先肯定有很多风格上的不同,理念上的不同,方法的不同,但是我个人更看重的一家管理人的核心能力可能是对风险的定价能力,这就是我们要说的第二个部分。

我们说的风险定价能力,这里面risk pricing,我们怎么定价一个风险,而不是我们传统意义上理解的风控,其实我们交易的核心就是在pricing risk我们买的每一只股票,我们控制的每一个仓位,我们对冲的每一个对冲工具,其实都是在pricing risk

图片

首先我们谈风险定价之前,我们先谈谈什么是风险。风险其实是一个非常主观的概念,不同的投资人,不同的机构,不同的管理人可能对风险有自己的定义。

比如说我们最经典的一个理解,风险可以理解成为drawdown或者是理解成为波动率,或者是波动率和收益率的比率,行业很多通用的Sharpe Ratio或者是Treynor RatioCalmar Ratio诸如此类,但如果我们把这个视角稍微往回拉一点,投资者我们会看胜率的波动,也会看更大的回撤,比如说去衡量取得正收益的概率和可能遭遇的收益的起伏,那么全面一点,我们可能就有了各种各样的这种夏普、卡玛、索提诺比率来帮助我们投资者衡量一个投资组合的性价比。

图片

我们用最大回撤做一个特别简单的例子,当然我们在具体的投资环境里边,可能每一个特定的交易资产risk的定义不同,为了理解我们讲一个简单的例子,很多渠道或者机构的朋友都经常问我说,我们的中性产品应该怎么样控制风险,或者是我们指增的产品应该怎么样控制风险?

我经常解释就是说我们所有的投资决策,可能都是从risk pricing的角度来看,什么叫risk pricing,我举个特别简单的例子,从回撤的角度来说,如果我最大的回撤是1%,那么1%的风险来博取1%的回报,我认为这不是一个特别划算的交易或者不是一个特别划算的安排。但如果是3%的风险来获取10%的回报,那么从风险收益比上来说,我觉得这个可能可以考虑。

所以回到产品的一些设计,包括一些风控的管理,包括一些超参的优化,很多管理人都在说很多的模型做到最后,包括超参的优化,包括敞口的种种的控制,其实都是一个选择题,这个选择题最终不同的管理人可能会做不同的决定,不同的决策,我觉得这里边一方面是有投资理念的区别,就是我要做什么样的管理人,我要做什么样的风格,我是一个稳健的还是低波动的,还是说我是要去博取高收益。

我觉得从我们的角度来说,我们永远是从胜率的角度来说,我没有绝对的对风险的要求,但是如果我要承担一定的风险,我必须要得到相应的回报。我们更愿意从这个角度来定义所有的关于这些超参或者是风险控制风口类似这样的问题。

图片

所以我觉得作为管理人,最重要的就是风险定价的能力,以及在风险定价上面的理念。我觉得这个理念是贯彻在它的整个交易的框架,包括一些重要的参数,重要的投资决策的过程当中,判断每笔交易和投资的潜在风险是否能够带来足够多的回报来覆盖风险,以及判断是否要承担某些特定的风险。这是我们管理人所需要关注的核心问题,也是一个管理人最核心的专业素养。

图片

但在风险定价的过程当中,除了我们刚才说的一些超参,包括一些流程和框架,当然也有一些现成的方法,比如从历史的数据里去发现一些规律。有一些标准化的风险评估和管理的模块,持续性的损益归因,这些可能都是行业中的比较通用的做法,我们在这个方面做的更多的努力是把更多风险的环节细化,然后把risk pricing的理念贯彻到整个投资框架的整个流程当中,以及一些重要的投资和交易的决策过程当中,从而在谨慎暴露风险敞口的情况下,追求最高胜率长期稳定的超额收益。

图片

最后一个部分是我们国内的量化投资往哪些方向走,我个人的一点感悟可能是大概4块。

第一是底层数据的多样化,大家都知道我们量化是一个基于数据驱动的投资的行业,如果没有海量的历史数据沉淀作为支撑和佐证,量化行业就很难发展。

图片

有些媒体朋友也经常会问我们在某些行情或者某些趋势下会不会做一些仓位上的调整等等。在量化的方法论里面,如果这个行为或操作能够从历史的数据上得出一些规律,或者是可以被验证,我们都愿意在这些方向做一些研究和尝试。

但是我们本身既不是做宏观研究的,也不是经济面的专家,演绎式的方法可能并不是我们擅长的,所以我们更多是根据数据来做一些决策,做一些归纳总结,然后在这里面找出一些更好的规律。

在数据类型方面,国内现在大家用的非常主流的,比如说量价,基本面,我们从交易所获取这些数据或者数据提供商都是比较容易的,这些数据也在变得越来越标准化。比如说最重要的现在像一些量价的因子其实仍然有效,而且胜率也非常高。

海外可用数据源的多样性上应该是比我们要很多,应该是我们的3-5倍,一方面跟海外行业的发展程度发展历史有关,另外一方面也跟海外的媒体,包括监管行业的资讯的获取的容易程度有关,有很多比较成熟的数据商会为你提供标准化处理好的一些另类的数据,在国内这方面虽然有一些数据提供商已经在这些方面在做一些尝试,但总体体量还是比较小,在整个市场跟其他数据所能够创造的影响来说,相对来说比较小,但可能是一个未来发展的方向。

图片

人工智能这个话题可能几乎所有的投资人都会问到,比如说在人工智能上的占比,用一些什么样的determing的方法,我觉得云计算、大数据、AI这些科技都是促使量化投资行业变得更加多元化,精细化和智能化的一些工具。更是因为算力的提升,而使我们量化行业实现了比较大的飞跃。 AI的应用在可解释性归因和样本内外不一致甚至计算效率方面,可能还有很多需要细致去斟酌的细节。但是最近智能化程度很高的ChatGPT大家都很熟悉,给我们带来一些惊喜,我觉得它对历史信息的调用整合输出逻辑,跟以往相比已经有了很大的进步,这可能对各行各业的发展都会有所促进,对量化行业其实也是会有一定的影响。

我们国内在人工智能的使用的程度上,我觉得普遍来说应该比国外同行的运用程度要更高,包括整个市场对人工智能的模型关注度也很高,利用多层神经网络,机器学习挖掘因子进行因子组合等等这些方面也都做了很多的尝试。但国外的话他们的AI应用可能更处于一个百花齐放的阶段,在哪个环节引入人工智能,AI怎么做,做到多深,可能都有不少的差异性,但是我们的观点是不管AI的工具发展程度、发展方向是怎么样,对于我们整个量化行业,是我们进行投研的一个工具,是辅助我们投资决策的。我们本身的定位是一个投资或者交易的公司,不是一个AI的公司,也不是一个科技公司,所以我们更多做的是AI的一些应用,当然在这里面应用有一些比较务实的结合。

图片

第三就是产品矩阵的国际化,我们之前在海外的经历其实也是从美国本土开始做起,后来做到了加拿大,后来在做欧洲,在做亚太市场。我觉得交易市场拓展是一个非常自然的过程,我们国内现在也有很多头部的量化管理人,可能已经开始着手在海外市场的一些布局,或者是海外市场的一些标的做一些投资和交易的尝试。因为我们过去的经验和过去的一些模型的原因,可能对海外市场会有一些natural inclination,我们也会在海外市场进行一些尝试和布局。

图片

人才可能是量化最核心的一个话题,团队的建设是每个量化管理人的重中之重,量化行业从来不缺非常聪明非常努力的人,尤其是在各个方面学历竞赛等等各种各样的光环一层叠加一点,这一点其实在国外的机构也都是一样的,国外的很多头部机构,可能都是招常春藤的名校,我们国内可能有类似的倾向,我看很多的管理人都是在招一些985学校的学生。

从我们自己角度来说,我们可能更加倾向于招一些应届生或者一些新人,因为我们觉得有一个相对比较长的培养的路径,而且他们不仅会有一个业务向上学习和磨合的过程,在价值观,方法论和对企业文化的认可度上都能够跟公司一起长期发展,所以我们在招聘方面的力度一直都比较大。

这就是我上面讲的大概三个方向,希望我们整个中国的量化行业,在各位参与者的和各位投资者服务者合作者的共同努力下,我们每一位可能都是中国近代或者近几年量化投资的历史的参与者、见证者和书写者,希望我们一起能够构建中国量化投资更美好的明天,谢谢大家。

「机器学习与算力建设在算法交易中的应用」

卡方科技  金基东

图片

大家下午好,我给大家做一个分享,主要是机器学习和算力这一块在算法交易中的应用。分享分四个部分,第一个是算法交易的综述,然后机械算法和智能算法有什么区别。第三个就是智能算法的内在逻辑是什么样的,它为什么表现会比机械算法会更好?第四个就是机器学习的应用和算力建设的情况。

图片

说到算法交易,我先要给大家普及一个概念。我们把私募基金、公募资金的整个投资过程分为两阶段:第一个阶段我们叫投资决策过程,也可以叫做投研选股过程,这个阶段收集数据,分析建模,最终形成一个投资组合,或者说直白点就是股票池。也就是说这个过程选择要买什么股票,什么时候买,什么时候卖。投资组合每天会有变化,变化以后就要调仓,调仓的过程我们就叫做交易执行的过程,也就是第二阶段。

图片

所以算法交易其实解决的就是大家在交易执行过程中的一个需求。就是解决大家交易执行怎么买的问题,所以它会有一些场景,譬如大单拆小单,譬如篮子交易等等。算法交易首先是要替代人工,因为人工做的话,不但耗费大量人力成本,还会有很多的问题,譬如需要避免道德风险、乌龙指、公平交易等问题。这都是算法交易可以解决的。

图片

算法交易在整个投资的产业链的位置,大家可以看一下,对于私募基金来说,他们普遍使用PB系统。刚才也提到整个投资的决策过程是先是做行业研究,做各种投资体系各种分析,最终产生一个组合。那么现在交易执行的人工被替代情况是什么样的?

其实它已经发展到了第四代,从最初的人工交易,到第一代教科书式的被动算法,然后到第二代机械的被动算法,然后第三代开始是机械式的主动算法,最后到第四代的主动智能AI算法。

图片

这个过程中技术也不停地迭代,一个是从被动变成主动,在技术的使用上也从传统的线性模型到机器学习、深度学习这个阶段。

刚才介绍了一下算法交易的概念,算法交易我们刚刚也提到它分机械算法跟智能算法。下图是一个典型的算法母单,交易目标是从10:0010:3030分钟内买入3万股某一只股票,这个算法母单的需求就是采用算法买入,然后它的成交均价尽可能的接近TWAP

怎么去做?这里先介绍一个最教科书的算法,我给它取个名字叫“霸道总裁”。他的做法就是每次都在每一分钟的开始去按对手价去买入,霸道总裁就是这样,他不在乎价格直接按照对手价去买这样做的话,因为它相对中间价来说,其实它亏了半个价差。市场的中位数的价格来算,这种方式它直接就亏损了0.06%

图片

大家可以看一下主要的票池,在这种方法下面,它的损失的价差的情况,中证500、中证1000基本上是0.08%左右。霸道总裁有没有办法去改进?

图片

图片

刚才说因为霸道总裁他不讲究价格,是买了一个不好的价格,我们可以做一个简单的思想去改进它,就是我们不再是每一分钟开始的时候去按照卖一价,而是每一分钟开始的前面58秒,先挂买一价,就是等着被动成交对吧?幻想的就是薅羊毛。到58秒的时候,如果挂单已经成交了固然是最好的,如果没有成交,我这时候就把它撤回来,然后再按照对手价去成交,这样改进以后,我们的绩效理论的绩效表现会是怎样的?

图片

我们做了一定的估算,这种情况下大概20%的概率可以薅到羊毛,可以以买一价来成交,赚半个价差这样算了以后,因为20%的概率赚0.08%80%的概率是亏损,亏损半个价差,最后跑输了0.05%,也就提升了3bp。这个算法我们给它取了个名字叫勤俭持家,因为上来先等一等,看能不能羊毛。

图片

这样会就带来一个思考,既然霸道总裁是亏万分之8,勤俭持家算法一个改进以后是亏损万分之5,我有没有可能做到不亏呢?甚至跑赢市场均价呢?其实刚才介绍的两种方式都是机械算法的代表,一个是每分钟的一开始买,一个是先做等待,然后再去买,都是机械规则去做的。

图片

机械算法能做到跑赢吗?其实很难,因为整个算法交易全市场来说,它在全市场上是个零和游戏。对于机械算法来说,它对日内的走势是没有预判的。市场上有大量的对日内走势有预判的算法或者交易员存在,所以这里机械算法对比其实是不利的。

图片

还有就是说对算法交易来说,它是有100%完成率的约束,比如他10:0010:30要买入多少股票,其实它是这个指令一下达,会要求在规定时间内全部完成。但是,市场上还有很多佛系的投资者,他看到机会好就买,机会不好就不操作,在这层,机械算法又是劣势。还有一个就是机械算法很容易被一些智能的算法或其他算法去识别出来,因为它有一些特征在识别出来以后就有可能被抢跑。机械算法存在这么多劣势,所以机械算法是不太可能跑赢市场均价的,这个时候需要用智能算法来解决这个问题。

图片

接下来我就介绍一下智能算法的内在逻辑。刚才说到机械的算法是没有预判的,而智能算法则是有预判的,它会对未来的价格做各种预测。另外一方面,挂本方价、还是中间价、还是对手价这些上面,像机械算法它都是既有的一些经验,一些规则,而智能算法在挂单这一块,也可以通过机器学习做一些预测。这些预测有什么作用?

图片

我们举个简单的例子,假设我在4分钟内要买入400股股票,如果价格是没有预测的,那么我们如果是想价格尽量的接近市场均价的话,我每分钟下单100股是一个比较优的选择,这个价格是10块钱。假设我的预测是第一分钟11块钱,第二分钟是9块钱,第三分钟是11块钱,第四分钟是9块钱,我有预测以后,我第一分钟我就不下单了,我可以在第二分钟的时候,我双倍下单买200股。这样成本就会更低。

当然这是有前提的,我的预测需要有一定的准确度,预测的准确度很低就抓瞎了。所以这个是智能算法最核心的一个逻辑,就是需要算法去对价格进行预测,这里就要用到基于机器学习以及深度学习的方法。刚才是说对价格的预测上面,另外就是对于盘口的预测方面,对出现这样的价格的时候,我应该是下本单价还是对手价呢?如果是说我预测未来价格会快速的增长,我有可能就是以对手价格快速成交掉了,或者说我需要选择一个中间价,这些都是需要一个动态的机器学习去才能做到的。

所以说智能算法其实主要就是在这两个点上去增强,然后可以去跑赢这个机械算法。

图片

卡方的智能算法,我们目前可以稳定得每笔跑赢市场均价3~5bp,我们相比于被动算法来说,增强可以做到0.08%0.1%单笔交易看起来可能获利极少但是对于量化私募来说,高年化换手是很正常的,如果年化换手是50倍的话,那么就是0.1%×505%的绩效增强对于年化换手100倍的私募来说,每年带来的收益增强可以达到8%~10%。所以我们卡方的算法交易在这一块是非常有竞争优势的。

图片

接下来,智能算法是如何去战胜这些算法的,为什么引入深度学习?我们发现随着因子数量的增加,随着Level 2数据的增加,数据量越大的情况下,越复杂的模型,它往往在数据量比较大的情况下表现会更好,下图就是线性模型和非线性模型的一个表现。当数据量少的时候,其实三个表现都是差不多的,但是随着数量的增大,树模型、深度神经网络模型就更有优势。所以我们会越来越多的引入深度学习的内容。

图片

其实机器学习、深度学习的技术在量化领域的引入是和技术的发展息息相关的,这是人工智能技术的一个发展的过程,前面我们不用特别关注,我们其实有一个重大的突破是2016年出现了AlphaGoAlphaGo在围棋领域战胜了人类。就是因为AlphaGo兴起以后让深度的神经网络以及强化学习在量化领域被引入。

图片

我们会根据这些交易规则设定非常细致的目标,这样的话就可以再用海量的数据持续地去训练,目标是以最少人为干预的情况下,去训练出一个比较优势的模型出来。然后现在我们的模型每天盘后都会进行再训练,就是用当天的新数据去再训练。

这是这几年的一些变化。一年前,我们是用人工的方式去产生因子,然后利用神经网络模型或深度学习模型去预测,然后再有预测结果,再结合人工规则改进交易决策。

现在70%就是原始行情直接用深度神经网络去做预测,然后有60%的深度神经网络去做决策的预测,这是我们自己的一些变化。这说明了我们整个投研流程中机器学习、深度学习使用的占比提高得非常快。我们未来比较理想的方式,就是直接从原始行情过来利用一个复杂模型做出交易决策。

图片

然后我们来看一下目前的量化行业的一些发展情况,其实这三年量化行业发展很快,其实也开始逐渐的内卷起来了。像早期我们叫做冷兵器时代,大家用多因子模型线性回归,然后基本上是做中低频后面就是热武器时代了,引入很多的量价信息、机器学习大家都引入进来,然后逐渐高频化。现在很多阿尔法已经做到了日内小时级别了。

现在不少量化私募甚至已经到了更高一级,我们叫做信息化时代,自建超算机房,然后去寻找很多的另类数据,然后把强化学习等最新的技术利用上来。

我们2018年的一个模型,2019年全年基本上不用改动,偶尔调个参,我们的算法模型都能是有比较好的绩效表现。但是到2020年以后,我半年就得做一个比较大的改变。到20212022年的时候,三个月甚至一个月做一次迭代,我们到目前每周都会去重新去训练,然后每个季度都会有模型的一些大的变更,所以说其实这个行业都在卷。

图片

看下算力这一块内容,都说数据、算法、算力是人工智能的三驾马车。人工智能在2016年之所有大的突破,主要GPU算力上来了,然后模型这些CNNRNN这些模型都涌现出来以后,先进的算法也有了,数据也进入爆炸期的。

国内量化领域,大家逐渐开始拼算力了,目前国内已经很多大型的量化机构建立了超算机房。这里举两个例子,一个是就是幻方的“萤火二号”超算机房,还有明汯投资的超算机房。

图片

最后介绍一下我们卡方在算力这一块的建设的情况。我们其实是2019年开始探索深度学习到高频领域的应用,然后2020年的时候引入了比较多的专家,并且开始投资建设我们的超算机房。然后我们第一代AI算法上也是在这一年上市,到目前我们的深度学习专家已经占到整个量化团队的1/3(量化团队共有60多位成员)。

到目前投入超过一个亿建我们的超算机房,其实建设超算机房最难的是拿不到足够的电力。我们后来在马桥创研中心,当地政府支持我们,对电路进行了改造,政府前期投入了2000多万,目前为止我们已经投入超过一个亿了。目前有200多台服务器,800多张顶级的显卡。所以说我们目前持续在深度学习这一块,在算法交易持续投入,这也是我们的算法,容量越来越大,绩效一直保持领先的原因。

我的分享就这些,谢谢大家。

「全文完」

重要申明

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多