很高兴今天有这么一个机会能够跟雪球的用户面对面交流,我们聊一聊量化,聊一聊投资,聊一聊基金选择。也是第一次参加雪球的基金Talk的会,有什么说的不明确、不准确的大家会后可以过来跟我直接讨论。
我们先聊一聊今天主要的内容,跟大家聊下:
①量化投资是什么;
②介绍一下现在主流的量化策略大概有哪些;
③讲两个案例,看看量化策略如何通过基金的形式来落地。
量化投资现在来讲可能已经不太陌生了,但在几年前很多人对量化投资非常陌生,他们认为量化投资是一个模型、是一个黑匣子,是一个不明确不确定,反正自己也搞不清楚什么东西。
其实量化是非常简单的,它其实就是一个工具,这个工具是一种方法,它能够通过计算机程序帮助投资经理实现自己的投资逻辑和投资理念,把一个复杂的事情、海量的数据处理得简单一些,节省时间。
量化投资在本质上跟传统意义的主动投资其实是没有什么区别的,只不过量化投资能够处理的数据更多一些。
接下来跟大家聊一下量化投资的发展,因为任何一种投资工具、投资方式都有一定的基础,从PPT我们可以看到量化投资整个投资理论发展是经过几个层次,大家有兴趣也可以看看这几本书和相关的论文。
首先是《投机理论》,是1900年一个法国的数学家写的论文,这个论文在当时没有产生很大的影响,后来翻译成英文版之后才好多人读这篇文,主要讲市场整个波动是遵循静态分布的,我们可以通过过去的一些股票收益率的数据、表现去预测股价的变化,但预测并不都是准确的。
第二本书叫《证券分析》,告诉大家我们买股票不是说我看了哪个名字好买哪个,我们要研究上市公司本身主营业务、发展逻辑、未来的增长潜力、业绩,我们要去全面的了解公司,通过了解这个公司再决定什么时候该买哪只股票。
我想起自己小时候的一件事情,高中毕业的时候,我从高中毕业就开始炒股票,当时不懂什么叫股票,问家里要了钱买股票,也不知道怎么选,冥冥之中我还是选了一条规则给自己,我买便宜的股票,就是底价股票,太便宜的我也不买我当时选5元到10元的股票,冥冥之中也有一条投资的策略或者主线。高中时候发生的事情也导致我之后读书的路径、从业的经历,导致现在做股票投资的工作,所以小时候的选择也很重要。
第三本书叫《资产选择》,它是资产配置理论和基础,后来随着有一些进阶《CAPM理论》、《套利定价理论APT》讲的市场组合和整个市场表现之间的相互关系。对所有做量化中影响最大、影响最深刻的也是现在所有量化都在使用的一套最基础的理论就是《French三因素模型》,他告诉投资者整个股票市场的波动跟单个公司的波动是没有办法有直接联系的,波动率涨的模式是不一样的。这里面提出了股票的市值、市盈率、占市值比等等因素可能跟股票的价格和涨跌幅有一些内在的联系。
国外发展的比较早,国内量化投资还是最近这段时间才逐渐进入到大众的视野,而且所有做量化投资最早做的就是指数基金,其实指数基金是最简单、最基础的量化投资,它是公开透明的规则,也是目前公募基金中规模最大的产品,里面包括纯被动的指数基金、指数增强;纯被动的指数基金根据产品的形式分成ETF、分级、指数增强型、一般指数型,规模目前接近6000亿,最近几年增长速度比较快,尤其是去年,去年有几个指数增强表现得非常不错。
后面出现了量化对冲型产品,它出现之前是有股指期货,在产品发展初期业绩还可以,后来因为股指期货整个当日交易手数受到了比较大的限制,导致了公募产品在量化对冲方面没有一个后续的产品发行,证监会对这类产品做了限制,暂时不发。
由于量化对冲型的产品收益率和波动率的特殊性,收益率比较稳定,波动率比较低,符合很多投资者投资需求,未来一旦股指期货再度放开限制,预测这类类型的产品规模也不会小。
现在最流行的受关注比较多的就是量化投资中的主动管理型的产品,在2016年可以看到所有的股票型资金当中排名前10的有一半多都是主动量化产品,基于那一年整个主动量化才进入了很多投资者的视野,接下来一段时间主动量化规模增长得比较快,目前在800亿左右。当然量化投资一般基于对过去数据的分析来预测未来可能的一种股票价格、市场,和表现,在这个行情极度变换的拐点的时候阶段型量化的策略会阶段的得效。
比如2017年初,因为2016年业绩非常好受到了关注,但是2017年初整个行情特别特殊,风格集中在大盘蓝筹,全市场20%的股票在上涨,量化取胜的股票短期来讲没有适应市场风格的变化,2017年上半年很多量化产品的业绩并不是特别好,主动量化的投资也是受到了市场的质疑,但是量化的特点就是它的纪实性和跟随性以及拓展性非常强,很多产品在2007年下半年整个因子模型、选择的标的都发生了一个比较大的变化,业绩还可以。
量化策略自上而下大致有这么5个方向:资产配置、量化择时、量化选股、CTA策略、套利交易。
我们会在后面细分讲一讲每个方向主流的策略,用案例讲大类资产配置。所有的投资者不管主动投资还是量化投资都是操作,择时对了你买的票只要不是太差你都是赚钱的,收益指数都是往上走的,所以择时策略做的人比较多,但是胜率比较低,要想做得特别好比较困难。
目前主流交易策略就是趋势交易策略,从过去数据来看反转类的因子比较有效,一个月和三个月反转因子效果很好。但是反转因子在2017年效果比较差,2017年整个市场不一样。2017年动量因子是最好的,所以在做策略的时候也要不停地做一些策略的择时。
第二个目前市场上研究的人不是特别主流的,缠论,这个有一些人研究或听说过,还是比较玄的理论,我自己曾经试图研究,翻了几页网上的大作实在看不下去,所幸我有几个朋友和校友刚好研究缠论,有一个叫“桃子姐”,跟她交流过好多次,虽然我不懂缠论,大概知道缠论研究的方向、目的、作用是什么,总的来讲缠论不能帮你做具体的择时判断,但是它可以告诉你在当下的情形你最优的操作是什么,以及未来可能的演变过程中你接下来又要做什么,它其实是一个在过程中不断变换的理论。
还有一种比较流行的就是形态择时,认为过去发生的事情或者过去相似的走势在未来是会重复的,比如举个例子,现在可能指数经过了两波上涨一波下跌之后,这种形态在过去是不是发生过,如果发生过就回去看一看,发生了之后后面市场怎么走的,通过回溯过去预测下一步的策略,这个策略用图形识别的算法来操作。
择时基本上用来确定大家投资的仓位,是要有头寸的,有了头寸你怎么在头寸基础上选股获得更高的收益,所以有很多量化选股的策略,多因子策略是市场上最主流、最普遍的一种策略,现在的因子非常多,不同的策略使用的因子是一样的,现在做多因子模型最要做的事情就是不停地寻找新的阿尔法因子,或者做因子择时这方面的判断。
除了多因子之外还有比较流行的就是事件驱动类的策略,股价的变化是一定受到市场情绪和事件的原因才能够有比较大的变化,包括刚刚李总说的上周五(3月23日),上周五是大家不愿意面对的话题和问题,也是一个事件驱动,就因为美国关税贸易摩擦,A股、美股都是下行,昨天晚上美股在收盘前一段时间又继续下行,这些都是作为事件因子来判断。
比较常见的事件因子有:上市公司大股东增持、减持;业绩预告;业绩快报;上市公司投资者调研等。
量化对冲其实是量化选股的延伸,我们通过对冲工具变成量化对冲的策略,相当于我把市场上的风险暴露去除掉,要阿尔法的收益。在量化对冲当中的量化选股是有一定基准收益的,因为你的对冲工具是确定的。现在市场上的对冲工具国内就是上证50、沪深300、中证500。
所以对冲工具的确立决定了选股的策略是在对冲工具的基础上进行选股,选得比较好多对冲掉市场风险之后资产收益率比较高,但是过去几年收益率都不是特别好,原因主要是因为股指期货端交易手数的限制导致股指期货长期处于贴水的状态,股指期货的贴水对策略负向的贡献是非常明显的。
近期股指期货的贴水基本上收敛得差不多了,可以预计到今年或者明年量化对冲会有一个比较好的表现,未来股指期货的限制放开,回到正常的水平,整个量化对冲类的产品规模也好、数量也好都会有非常大的变化。
接下来要讲的量化策略就是套利,无风险套利从定义上来讲就是没有风险的,一定是赚钱的,实际上多多少少大家做套利的时候还是面对一些风险,最常见的套利就是期货套利,分为股指期货套利和商品期货的套利,商品期货的套利量大一些、套利策略的种类比较多,跨期套利、跨市场套利、跨品种套利,不同的策略面对的风险也不一样。
接下来大家了解和接触比较多的就是基金套利,基金套利之所以能够出现是因为它有两种价格形式,最常见的就是ETF套利,同时有两种价格形式,一种是交易价格,ETF是可以像股票一样在二级市场进行买卖,有交易价格;同时ETF是基金所以它又会有一个申赎的价格,是根据ETF本身净值来决定的,不受交易情绪以及买卖挂单的影响,由于可以通过这两种价格获得统同一种基金份额,只不过价格不一样。
当这两种价格偏离到一定程度就会产生套利空间,就会有套利投资者进行买卖。举一个沪深300的例子,当ETF场内交易价格高于基金净值的时候,这个时候就产生套利空间了,这个会有套利者按照基金的实际净值申购ETF份额,而该份额当天是可以卖掉,因为二级市场价格比较高。
除了ETF套利,前两年比较火的就是分级基金套利。因为ETF套利比较容易判断、比较容易程序化,套利空间越来越小,做的人越来越多;它又是实时的,因此整个套利空间被压缩到很窄,基本上人工是捕捉不到这个机会的。
后来分级基金出现了,由于它不是实时套利,所以其套利空间特别大,它是延期套利,存在T 1或T 2的时滞,所以套利空间比较大。前几年分级基金特别火,包括我们公司本身也是分级基金数量最多的一家基金公司,当时分级基金规模非常大。
分级基金套利和ETF套利原理是一样的,分级基金有三类份额,母基金加A和B的份额,A和B能够跟母基金进行转换,所以分级基金也是有交易价格和实际净值的,当母基金和A B出现价差时,就可以进行套利。
套利下面更细分的就是“交易”,前两年突然间宣传得比较多,或者说进入到大众视野的T 0工厂,他们每天手里有一堆股票判断一分钟甚至几十秒的股票行情进行买和卖的操作,全是人工的,交易虽然是最近两年才出现在公众视野,但实际存在这个事情已经很久了。
我读大学的时候收到一个传单,招股票交易员,交易的是美股,我仔细看了一下传单上面说提供资金、提供办公场所,你只需要业余来上班,要求赚到钱公司给你分成,亏钱了一分不用赔。
当时觉得这应该是骗子,怎么可能有这么好的好事,所以我就拒绝了那个人的邀请,多年之后逐渐了解之后才知道确实是有这样一种职业。当时做美股交易的人确实赚了很多钱,后来美国专门把这种交易限制住了,所以最早做美股交易员的这些人在回到国内很多都是做了私募公司,就是T O工厂这些创始人,交易品种也从美股延伸到A股,不同的是A股不能做T 0,因此需要底仓,并进行量化对冲。
现在纯人工做T 0交易的私募也在逐渐减少,大部分也是开始进行程序化,招聘很多做量化的人,主要帮他们写程序,把交易员操作的理念和方式方法用程序固化下来,这其实就是我开始讲的量化就是一个工具,是一个方法,它跟主动投资没有什么区别,重要的是在投资经理,投资经理的思路和思想才决定这个策略、量化投资的成与败。
除了T O,基于做市商交易的就是CTA,主要还是以商品期货为主,也全都是程序化,因为是高频的人工操作是不可能下去的,对于中低频的策略可以用人工,现在大部分都是高频。
这是从上到下5个维度,我们讲了量化的策略干什么。
最后从两个实际的案例介绍一个量化策略具体是怎么生成的,以及怎么运用到基金选择上。
蛋卷上大部分投资者关注的就是指数基金,因为指数基金是比较透明的也比较明确,现在做的指数基金也很细,有宽基的、行业的、主题的还有很多细分子板块的指数基金,这个其实对有一定经验的投资者特别好,他看到哪些板块直接买那个板块的指数基金就好了。
对于市场上很多主动型管理基金你其实很难判断这个基金在做什么,甚至连它的仓位是多少你都不知道,但是指数基金我可以告诉你仓位基本上都是95%,ETF就是100%。所以这个风险暴露很高,要的是你去选择。
所以指数基金特别适合用量化的方式做选择和轮动。
这里我介绍两种,一种是自下而上来做行业轮动,另一种是自上而下做大类资产配置,通过这两个案例希望让大家了解量化策略从有一个想法到它最后生成的过程。
这个过程主要分为5块,最重要的是第5块:
第一块是你首先要有一个想法,即投资思路和投资逻辑是什么;
第二步你想实现你的投资逻辑和投资理念你需要用到什么样的数据、什么样的指标,这些指标是否是可查的、公开的;
第三步就是这些指标我怎么使用,在什么样的维度、什么样情况下去使用判断这些指标;
第四步就是数据回测,回测在你的思路下是不是真的能够赚到钱。当然一个量化的策略在这四个纬度是要不停地迭代,一个轮回之后要回测、优化,然后再轮回一组,基本上如果回测效果比较好的话这个策略就算成型了;
第五步做样本外的跟踪和检验,是不是真的在实际投资过程中能够带来收益。
做行业轮动策略很多,我们这里用到一个策略是因子极值的策略。
我们按照4步,为什么会有这样的想法?股票每天变动的原因是什么?当然大家都知道上市公司基本面盈利情况是一个股价变化的最根本,但是这种情况不可能每天都在变,但是股价每天都在变,是什么让我们去交易这些股票让股价发生变动?我觉得是情绪,情绪分为几个维度,当我们听到普通、优秀、特别优秀、惊为天人,你的感受不停的进阶,你听到一个股票不涨不跌、涨停、创一年新高、创历史新高,你的交易冲动和你购买和卖出的欲望是不一样的。
基于种想法我们想每个股票有那么多因子,每个因子都有不同纬度的情绪或者有这么一个数值的变化,我们就想把数值的变化,尤其突破某一个极限之后的变化,用来做决策。因子的变化是能够产生股价变化的,基于这个想法我们觉得可以把因子极值突破作为投资的逻辑。
同时我们希望做行业轮动,行业内的股票有很多,每个行业内股票它其实是有趋同性的,我们将同一个行业内所有的股票是不是做了极值的突破,来作为指标,如果这个行业大部分股票在这个因子上创了最近一年的新高,那我觉得这个行业针对这个因子就可以作为买入卖出的判断。这是第一步。
第二步我们需要准备数据,每一个股票的因子有很多,包括技术面因子、成长因子、规模因子、公司质量因子、盈利因子等等,因子很多,而且这些因子基本都可以获取,可以通过上市公司财报、股票交易价格和成交量获取,采集数据后,第二步就完成了。
第三步怎么处理这些因子?刚才也说了我们因子的变换是要它突破一个极值我们才去作为一个信号,这里可以规定一年、半年都是可以的,这是一个处理规则。
最后根据前三步开始进行第四步的数据回测,回测之后我们发现不同的行业有效因子是不一样的,比如说银行板块,对于银行板块来讲有效因子是技术面的因子,即动量和反转的因子,还有价值因子比较有效。对于楼房板块可能是盈利因子和公司质量因子比较有效。
不同行业有效因子不同。我们针对每个行业使用的最有效的因子做了这样一个行业因子极值突破的策略,可以看到绝大部分的胜率都比较高,都在50%以上,高的有80%。分年度来看,超额收益只有1年是负的,绝对收益看当年市场情况。从整个效果来看这个策略还是不错的,目前前一、二、三、四步骤都完成了。
这个策略最新一期的结果是什么?最新一期是2018年3月份,选出来是三只产品,因为我们都做行业,对应了一下我们自己公司的行业指数基金,酒、国防、地产三个行业,事情也是发生在大跌之前,三个行业的数据都还不错,我们没有看最新的数据,在昨天之前每个行业都是在5%以上的。这是由下而上通过各股到行业再到基金选择和轮动的策略。
接下来讲自上而下的大类资产配置的应用,同样是分为4个步骤,大类资产配置主要根据投资者的风险偏好、目标、收益来进行不同资产类别的分配,国内能够投的大类资产配置4个,股票基金、债券、商品、货币。
根据每个投资者的风险偏好我们对每类资产做一个权重的分配,基本上你做了资产分配之后整个组合的收益波动曲线都比较明确,不会有特别大的变化,我们要做的就是在每一类资产当中比率上做一个优化,比如我选择什么样的基金可以增加基金权重的头寸让基金收益更好一些。
第二步,我们做大类资产配置的时候我们投资逻辑是什么?我们认为宏观指标是对每一类资产是有影响的,第二步就是梳理这些宏观指标,分为七大类共50多个因子,对债券、股票、商品都是有影响的,这些数据基本上都是可以获得的,有的公开的频率不太一致,我们把公开时间进行一个调整,让所有的指标时间都是统一的。
拿到数据之后我们再讲第三步怎么处理这些指标,处理这些指标是做量化非常关键的一步,在宏观因子就会发现一些事情之后才去认为宏观指标产生效用了。比如有四类事件,短期新高、短期新低;历史新高、历史新低;指标连续上涨、连续下跌;还有反转类的如连续上涨之后下跌、连续下跌之后上涨。
通过上面第三步就可以进入实证的阶段,最新一期的资产配置我们对应的标的是这么几个,首先多投资产是可以配的主要是沪深300、沪深500,还有资源类和金融类的。