分享

从入门到实操!可能是目前最好读的量化交易白话科普!

 K舞飞扬 2018-03-22


导读


在大多数人的想象中,量化交易似乎应该是用十个显示屏跑的数学模型,交易速度以微秒计的深不可测的投资方法。诚然,复杂模型和高频交易固然属于量化范畴,但广义上,量化代表的是一种理性的思维方式。譬如,当你着眼于真实数据,理性地运用逻辑分析和归纳统计得出一些市场的观点和规律,并据此制定和执行明确的交易策略时,你就是在做量化交易普通个人投资者完全可以运用量化的方法来指导自己的投资决策,甚至常常不经意间就已经用到基于经验、逻辑和数学的量化投资的思维来指导自己的交易。


本文试图来简单归纳一下理性量化交易涉及到的基础认知和做法。


量化因子



量化就在我们身边,普通投资者“日用而不知”。当投资者在选择股票和判断交易时机时,往往就用到了“量化因子”。


所谓因子,就是选股条件——一些人为抽象出来的各种特征或看待事物的角度。这些特征和角度往往基于经验的总结。


举例来说,如果让我们从一群人中挑选出可能跑得快的人,基于经验,多数人会挑选“腿长”、“健壮”的人,所谓的“腿长”和“健壮”就是两个因子。思维粗糙的人会凭眼睛看、凭感觉去感受何为“腿长”,何为“健壮”;而理性较真的人则可能会广纳样本并通过数学模型统计工具厘定“腿长”和“健壮”的尺度。


在股市里,为了尝试总结出什么特征的股票能在未来取得高收益,我们同样会抽象出各种因子。信奉技术分析的投资者可以通过K线形态、每日的交易价格、成交量、换手率等归纳出一些因子;基本面投资者在分析企业家背景、企业财务状况、股权结构时,会使用很多财报指标作因子;宏观投资者自上而下研究会选择国家存贷利率、货币数据、行业生产数据等做因子;时下流行的大数据分析等时髦分析法其实也是在试图挖掘出一些不那么常见的因子,比如通过股吧评论、股评推荐个股数据等。


不同因子背后的逻辑是有区别的。比如,基本面财务数据中的“市盈率”因子就是一个接受程度很广的因子。市盈率是指每股股价与每股盈利的比率,是从企业盈利角度来评估股价是否合理的常用因子之一。买入市盈率较低的股票,在逻辑上反映了你能以相对较划算的价格买到相对盈利能力更好的企业,这听上去是一个合乎常理的应该是对的行为。因此,尽管到底市盈率要到多少股价才算便宜完全是个见仁见智的问题,但将市盈率因子运用在投资中,持有一些低市盈率的股票,是寰球市场都存在的常见投资行为。


有别于“市盈率”这种带着事理的因子,有些因子就比较依赖于人的行为本身。比如市场人气、筹码分布等等。我们假设这样一个实验:一个班级里投票评选出班花,每人交50块,投票投中最后班花人选的人可以得到200元,没有投中的人失去本金。此时大家所聚焦的,可能就不是“班花”本身,不是“我因为哪些条件认为谁最漂亮”而是“我能通过哪些条件判断出谁被大多数人认为最漂亮”,其它人的想法比我的想法更重要。


无论持有哪种信念的投资者,都会有他看待市场的角度,有他自己分析判断市场常用的因子。只要运用得当,因子之间没有绝对优劣之分,只有角度之别。一切只取决于你对因子本质的理解是否到位,运用因子时是否足够精确和严谨。


量化策略与量化交易


有了因子,我们相当于有了制造食物的原材料,接下去就是按什么配方,用什么样的机器去加工出食品。


所谓的配方,就是一个交易策略。

中餐的配方往往是模糊的,比如盐少许、糖适量等等,而西餐的配方,相对就比较定量和精确。但无论是什么餐,你总会有个心中的配方。以前从没接触过量化策略的投资者,会潜意识地使用各种因子搭配出一个模糊的交易策略,用心中这杆秤粗略地评估给予哪些判断条件更大的权重


比如,当一个投资者决定入场买卖股票时,他很可能会看一下公司当前的消息,然后再看一下公司的经营情况,考虑下公司的行业在未来是否有发展空间,最后再根据公司的走势图决定是否买入。那么这个模糊的配方,就揉杂了多种原材料,并且,分量最大的是一种叫股价走势图的东西。


人心中这杆秤常常会因为外部因素、市场情绪、个人认知非理性偏差等原因发生倾斜,导致煮出来的食物过咸或太淡,每次做出来的口感质量还不一样。“可获得性偏见”是人们在作出判断时经常犯的错误,指的是人们在做判断时经常利用自己熟悉的或者是凭自己想象能够构建出来的信息,导致赋予了那些易见的、容易记起的信息过大的权重。


比如,911飞机失事后全球新闻联播,这个公众事件改变了某些即将出行的人对于交通工具的选择,这种心血来潮的倾斜,实际上是不理智的。市场上的大多数人都认为自己心中的那杆秤的忽上忽下是一种“随机应变”的灵光一闪,但这些主要靠灵感的配方,很可能做出来暗黑料理。


量化策略要做的事,就是排除主观的模糊与偏见,客观地了解市场过去的历史,通过归纳选择出选股因子后,用前后一致、定量精确、可重复执行的原则分配权重,指导选股。


一个完整合格的量化交易策略,应该明确地包含标的筛选条件,买卖条件以及买卖仓位三大要素。


有了配方,你还得选择用什么机器来加工材料。在投资中,所谓的加工机器,就是一个执行你的量化策略的平台。


一般券商给客户提供的行情交易终端,大都只支持简单的手工交易,就好比自己烧柴火炒菜一样。如果你的策略比较复杂,涉及到多只个股同个时间的定量买卖,并且希望自己不用动手,那你就需要一个智能料理机了。自动执行设定好的交易策略的方式,就是程序化交易业内部分券商给客户提供了支持程序化交易的平台,比如第一创业证券就有多个不同风格和特性的程序化交易平台供客户使用,比如一创量化通、一创聚宽等等。


单因子策略



单因子量化策略,是最简单、最容易执行的量化策略。在这个策略中,标的筛选、买卖条件和买卖仓位,基本由一个核心条件决定,或者说,这个策略所带来的投资收益,大都源于一个核心条件。构建一个单因子策略,可以让我们非常直观地,看到每一个因子在市场里的历史过往表现。


由于量化策略的定量准确和可复制性,我们可以在真实历史里模拟出这个策略的历史投资收益曲线,也就是假定从历史某天起就一直使用这个策略炒股的账户总资产变化曲线。


这里先给大家补充下投资收益构成的基础概念。投资的收益一般分解为两部分,一部分是你所参与的市场或你所选择的参考范围的均值回报率——beta,另一部分是你相对于均值回报率的相对收益——alpha。很显然,假如相对收益为正数,则意味着我们的投资收益超过了你的对比范围的平均值。每一个量化策略,都代表着一个投资的角度和方向,都有它的历史收益曲线,假如这个量化策略的收益曲线超越了市场均值,那我们就可以认为这个策略在过去那段时间是相对优秀的。


那么,整个中国股市的平均回报率曲线是怎样的呢?我们可以用历史全市场股票的平均每日涨跌幅来生成一条市场平均回报率曲线。这条曲线表达的是假定你把全市场所有股票等权买了,并且每天都对持仓比例进行等权平衡的累计回报率,如下图(不考虑停牌、涨跌停无法买卖的情况)。


(坐标系:等差坐标,数据来源:笔者整理)


2007年1月4日起至2018年3月,从1增长到10,收益为10倍,这就是中国股票市场近12年的近似平均回报率。可惜的是,很多投资者从来不关心历史,不但对这个事实一无所知,还以为中国股市从来没给投资者创造收益。当然,你没有办法把所有股票都买了,这个均值回报曲线只是个模糊的参考数据。


我们现在来举例两个很常见的单因子量化策略,来看看假如一直使用这两个选股条件选股,能获得怎样的历史回报率曲线,能否成功超越市场的均值回报。


第一个单因子策略,用的选股条件叫股票市值。


根据策略三要素,标的、买卖条件及仓位。确定如下策略:


标的筛选条件:剔除掉上市不足30天的次新股、ST股后,选出前一天收盘后全市场总市值最小的前50只股票,构建交易范围;

买卖条件:每个交易日开盘买入交易范围内所有股票,卖出不在该范围内的所有股票;

买卖仓位:限制为每只股票等权买入总资产的2%。


同时,每次调仓设置了来回千分之四的交易成本,并且根据历史停牌、涨跌停不能买入卖出的情况作了调整,不考虑市场真实容量及交易对市场的冲击



(坐标系:等比坐标;数据来源:果仁网)

 

 图是这个小市值量化策略的历史模拟收益曲线,2007年1月4日至2018年3月16日,回报率为14279%,也就是12年143倍。如果只持有排名最小的前10只的话,这个回报率达到了惊人的几百倍。不过,近一年来,也就是2017年3月到2018年3月,最大跌幅曾高达40%。这是一个名副其实的高风险、高收益量化策略。显然,它的历史模拟回报率远超历史市场平均回报率,在过去的十几年里,这个选股条件总体上是有效的。


第二个单因子策略,用的选股条件叫动态市盈率。


根据策略三要素,标的、买卖条件及仓位。确定如下策略:


标的筛选条件:剔除银行股后,选出前一天收盘后全市场动态市盈率最小的前25只股票;

买卖条件:当天开盘买入交易范围内所有股票,卖出不在该范围内的所有股票;

买卖仓位:限制为每只股票买入总资产的4%。


同时,每次调仓设置了来回千分之四的交易成本,并且根据历史停牌、涨跌停不能买入卖出的情况作了调整,不考虑市场真实容量及交易对市场的冲击


(坐标系:等比坐标;数据来源:果仁网、笔者整理)


图是这个低市盈率量化策略的收益曲线,2007年1月4日至2018年3月16日,回报率为2325%,也就是12年24倍。近一年来,也就是2017年3月到2018年3月,也取得了30%左右的回报率。这当然也是一个超越了市场均值回报的策略,表明低市盈率在过去的历史中是一个良好的选股条件。


中国市场的投资者其实每天都在看着单因子策略。


我们平时打开行情软件看到的上证指数、沪深300指数等等,广义上来说,就是一个个以市值为核心的单因子策略:


标的筛选条件:在全市场成交额前50%的股票里,用总市值因子从大到小排序,筛选出前300名;

买卖条件:每年的6月和12月的第二个星期五的下一个交易日,持有交易范围里的300只股票,移除不在交易范围里的股票

买卖仓位:根据样本股的流通股本加权决定持股比例,总体来说,流通股份越大,个股持仓比例越高。


这个指数从发布日至今的表现,近似的就是这个单因子策略的历史投资收益曲线(忽略分红除权和交易因素)。当然,对于成分股,官方还有一些限制条件来做标的过滤,必要时会根据市场现况单独剔除某些股票等,这就不去深入讨论了。毫无疑问的是,这个指数就是一个以大市值为核心的量化策略。


因子和收益的相关性




我们可以通过观察不同的单因子量化策略历史收益曲线,来粗略的感受一个因子的历史有效性。不过,就算是一个因子,利用的方式也有多种。上面我在构建策略的筛选条件时,都是将选股因子从小到大排,如果反过来排,又是什么结果呢?有没有可能其实某段时间反过来排收益更高?又或者这个选股条件其实跟回报率并没什么直接关系,你所选的这些股票能获得这样的回报率仅仅是碰巧如此而已?


想回答这些问题,我们必须要研究下因子和收益率的关系。如果我们想深入分析一个选股条件与收益率的关系,就必须作出它的信息系数(IC,Information Coefficient)图。


IC图能直观展示因子和未来收益的相关性。


以上文所举两个因子为例。


针对总市值这个选股因子,IC图的作法是:对当前全市场股票按照总市值从小到大排序,然后再对股票后面5日收益从大到小排序,最后对这两个排序计算相关系数。若相关系数为正,则表示当前市值越小的股票在其后取得相对更好收益正相关,反之,就是负相关,即股票市值越小在其后反而收益越差。相关系数的绝对值越小,意味着弱相关,反之,则是强相关。下图是2003年到2018年初市值因子的IC图。


(数据来源:Wind、笔者整理)


我们可以清晰地看到,在2003年到2007年之间,强正相关和强负相关互相切换,2007年到2011年,大体是强正相关,2011年中-2013年中,整体相关性偏弱,到了2014-2016年,又是整体强正相关,2017年开始,强负相关。换句话说,上面那个只用市值因子从小到大排序的量化策略,在过去12年取得了那么耀眼的回报率,其实并不一定是这个条件的功劳。在弱相关那几年,有它没它都没什么区别,而强负相关那些年,它还帮了大大的倒忙。然而,在它确实领了功劳的那些年份,它与收益率的正相关性实在是太强了,正是由于那些时间它优秀的表现,这个策略才取得了12年过百倍的回报率。


再来看看“市盈率”因子与收益的IC图。同样,先将对当前全市场股票按照市盈率从小到大排序,然后再对股票后面5日收益从大到小排序,最后对这两个排序计算相关系数。


(数据来源:Wind、笔者整理)


我们马上可以看出来,这个市盈率因子的IC图和刚才小市值的IC图差异较大。在2003-2018这十几年时间里,低市盈率和高收益率大部分时间都是正相关的,但相关性常年在0-5%区间波动,明显没有刚才的小市值因子那么强。在2013-2015年期间,出现过一段时期的弱相关和负相关。这个结论表明了,市盈率越小,回报率越高基本上在大部分时间都是对的,也就是说低市盈率这个单因子策略,确实绝大部分收益都是这个因子的功劳。只在少数时间,这个因子无关紧要或者帮了倒忙。


通过计算出单因子策略的历史收益曲线和它与收益率的信息系数图,我们可以全面直观的观察到市场历史,能够明白我们所押注的因子的特性。


就上面介绍的两个因子而言,市值这种干起活来虽然很给力但贡献极其不稳定工作态度有点问题的因子,使用的时候必须更考虑时机;像市盈率这种勤勤恳恳,大部分时间都在默默贡献的因子,我们最好的方法是长期坚守这个方向。值得注意的是,在2012、2013这些年份,这两个因子都呈现出与收益弱相关的现象,实际上在那几年,大部分因子与市场收益都弱相关;而在2008年,就算勤劳尽责的市盈率因子依然和收益正相关,但也只是市盈率小些的股票相对亏少些,那一年几乎所有因子的绝对收益率都是负的。这表明总有一些时间,你走哪条路都是原地踏步,你做什么选择都会徒劳无功,我们要接受这些事实。


每个量化因子,都是市场的一个方向,都能提供一个不同的角度观察市场。选择哪个因子来组建量化策略,本质是在复制市场这个方向的收益。用多个常规因子的历史收益率曲线和IC图观察,能够加深我们对市场的理解,使我们对这个市场的了解更全面,这就是这两节内容希望告诉读者的东西。


多因子策略



正如我们不会只用一种原材料做菜,在实际的投资中,为了将风险分散,不把鸡蛋都放在同一个篮子里,我们往往不会只使用一个条件选股,只使用一个单因子策略。


一个对个人投资者比较合理的投资思路是,在对市场常见的因子作一些直观的统计后,根据自己的喜好,挑选出想用的因子来混合量化策略。


用多个因子来组建的量化策略,就是多因子策略。


做一个多因子策略最简单的方式就是,选几个单因子策略,给它们分配不同比例的仓位,然后合并起来即可。这里简单介绍一下组建多因子策略的推荐步骤。需要注意的是为了使得混合因子能真的起到风险分散,角度更全面,层次更丰富的效果,多因子策略里的因子之间,相关性一般要求小一些。


第一步,先粗略地看看市场历史中一些常见因子的回报率情况。


(数据来源:果仁网)


上图是近3年来全市场常见单因子策略回报率排序的前十名。上文用于举例的两个单因子也在列表中。为了讲解方便,我们就选取小市值和动态市盈率两个单因子策略来合并一个多因子策略。


第二步,用这两个因子分别组建单因子策略,然后合并构建一个多因子量化策略。


我们按上文量化单因子策略的设计步骤,分别生成等权买入市值最小的20个股票、等权动态市盈率最小的10个股票这两个单因子策略。策略内部设置开盘按交易范围调仓。


随后,令这两个单因子策略分别占账户总资金的1/2仓位,整个账户共运行2个单因子策略,持有30个股票。


实际筛选过程剔除了上市不足30天的次新股、ST以及银行股,并考虑了来回千分之四的交易成本以及涨跌停、停牌导致不能交易的情况,不考虑市场容量及交易行为对市场的冲击。


这个合并后的多因子量化策略历史收益率曲线如下图:从2011年1月1日至2018年3月16日,获得了1049%的回报率,也就是7年11倍。


(坐标系:等比坐标,数据来源:果仁网)


     如果从2007年1月4日开始计算,这个收益率是11687%,12年近120倍。

(坐标系:等比坐标,数据来源:果仁网)


再来看看这个混合出来的多因子策略逐年表现:



除了2008年一年亏了近50%以外,绝大部分年份都是正收益,2007、2009、2014-15三段牛市,为总资产贡献了大部分收益。


混合而成的这个多因子策略与上文介绍的小市值单因子策略相比,两个策略持仓股数都在三五十只,也都取得了10多年过百倍的历史收益,但小市值单因子策略波动巨大,近一年就亏了近40%,而且其与收益的相关性波动也大,经常性地罢工。


相比之下,多因子策略可以让整个账户不要太依赖某个方向,相当于给一份工作找了几个备岗,某个因子罢工请病假的时候,起码还能期望剩下那几个干点活。这样一来,工作效率可能是降低了,公司可能也多了些冗员,但起码运转起来更平稳,更能抵御事况的变化。


最后要说明的是,上面的历史回报率计算没有考虑市场的真实容量以及买入量对市场的影响。考虑到市场容量,上面提的一些策略只持仓几十个股票想真的获得上百倍收益率很难,因为你一只股票可能一下买不到那么多。一只股票你一笔买几万元是没有问题,在收益率上来后,一只股票可能需一笔买入几十万,很多股票是没有这个流动性的。你必须分笔买入,这会导致交易成本和交易滑点的增加。另外,在实际当中,如果对某个股票发生大量的买入行为,本身就会影响到它的走势。也就是说,上面的历史回报率计算会虚高,但大体上没有方向性错误。


成为量化投资者



通过上面的解释,我们可以看到,量化投资不是一种独特的交易流派,只是一种借助历史数据和归纳统计逻辑完善我们分析思路的态度。无论你是价值派、技术派、消息派还是低风险投资派,无论你经常做的是股票、债券、商品还是期权期货,其实都需要量化。相比于靠个人经验作决策的投资者,量化投资者手中的武器就是市场证据和理性。


用好量化投资,除了能排除决策中的主观偏见,克服心理障碍,帮助投资者做到知行合一等好处以外,它还能大大缩短投资者的研究时间。A股市场有3000多只股票,巨大的股票数量给基本面和技术面投资者的分析带来很多困难。任何人都有能力圈,时间都有限,如何能够迅速把握住市场不同时期的特征?量化通过因子的概念将3000只股票重新归类为不同的因子,投资者通过观察不同因子的历史表现,就可以起到一叶知秋的效果。


不同的因子,其实就是观察市场的不同角度,用不同的因子来构建我们的持仓,其实就是复制市场不同角度的表现。回报率高的角度,就是所谓的风口、潮流。有了因子的思维后,我们不需要去判断每一只具体的股票未来会如何,取而代之的是去全面了解市场真相,判断哪些因子、哪些角度将会是未来的潮流,勇敢地去跟随市场的脚步。我们的投资行为将变得更为客观,更有条理,更重视数据,更能开放地倾听市场自身的声音。


最后,神通敌不过业力,时运大于人运。如果你发现了某些选股因子在过去特别管用,千万不要以为你发现了圣杯,你只是赶上了时代的洪流而已。某些人终其一生都用同样的投资思路来做挖掘股票,从量化因子的角度看,他不过是一直追随着某些因子,然后正好那些因子在其有生之年相当有效。


美国“债券之王”Bill Gross说过一段话,“每个投资大师,像巴菲特、索罗斯,还有我自己,都受惠于这个伟大的时代。一些投资者承担了一些风险,加了一些杠杆,获得了一些回报,便被冠以“大师”的称号,殊不知他们只是比较幸运而已”,大概说的就是这个道理。毕竟,上文所述的思维模式,在逻辑上大都属于经验归纳,然而诸行无常。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多