目前量化投资在A股市场的交易占比已超20%,对于个人炒股者来说,你每交易五次,就有一次在和机器对决!” ——启林投资王鸿勇 2020年仍然是量化超额业绩大年,在中证500指数收益20%的基础上,量化大厂年内中证500指增的超额普遍在20%以上,可谓延续了2019年的强势,其中三家头部机构明汯、九坤、幻方虽做法各有特色,近三年每年超额也各有起伏,但2020年的超额都稳稳地站上了20%。 截至2020年11月底,好买主要跟踪的量化私募中,多数机构主要采用的仍是量价多因子模型。该模型在美国发展几十年,有强大的学术和实证基础,在中国的超额也依然不错,是条大家已经踩出来的近路。与之相对,AI,或机器学习模型近几年刚刚兴起,应用者有限,更像是一条少有人走的远路。但如今,越来越多的量化机构开始“舍近而求远”,机器学习在中国的实战业绩到底如何?有没有效?能不能持续? 机器学习2020复盘 多只机器学习产品超额战胜 量价多因子 启林于2019年下半年彻底从量价多因子策略转到机器学习方向,2020年,启林指数增强产品将中证500指数20%的收益增强近3倍,超额水平拼进业内三强,成功转身。 以中国量化策略的迭代历史来看,从2013-2014年以风格、市值因子为主的简单量化,到2018-2019年多因子模型的全面兴起,再到2020年机器学习策略的渗透,超额常有,只是“今人不见古时月,今月曾经照古人”,同样的超额背后有着不一样的策略线和故事线。 策略快速迭代,行业滚滚向前,机构起起伏伏,生生死死。近两三年,凭借量价多因子与日内高频打下天下者,不需要做过多行业或因子暴露,就能稳稳地拿下年化20%、30%甚至40%的超额。然而随着量化多因子的主航道愈发拥挤,叠加近期市场风格变化,一些机构的超额裸出负值,量化私募们不得不持续鞭策自己保持迭代。 如今,机器学习策略正成为量化投资可能的最新爆发点与最前沿方向。不管是为了进攻还是防守,中国的量化机构多多少少已在尝试机器学习这条远路。 机器学习如何理解 数据分析技术的革命性进步 It’s a revolution,not an evolution.这是一次革命,而不是一次变革。 人工智能,或机器学习,对量化行业来说,更像是数据分析技术的一次革命性进步。 从数据中寻找规律,传统的回归方式是在样本内找到全局最优解,以函数论为基础总结最显著的规律;而机器学习根据已知数据做概率统计,对下一步进行最优预测,从局部最优到全局最优,以概率论为基础一层层得出最终结论。 简单类比,我们想从A走到B,如果知道起点、终点和道中每个路口、街道的信息,那可以画一条最优路线,这是传统的回归思想。我们也可以从A出发,每到一个十字路口就选一个方向,把所有街道、路线都走一遍,我们走了10000次之后,可能有500种方法能到B,在走第10001次的时候,我们在每一个路口就能知道去往终点的最优选择,这即是机器学习的思想。如果说线性模型生而为了让我们理解世界,找寻规则的话,那么概率模型生而为了让我们预测世界,预测未来。对于金融市场海量的结构化数据而言,对于量化机构预测资产收益的终极目标而言,只要输入足够多的数据与特征,机器学习的拟合能力其他策略无可比拟。然而,问题也恰恰出在这里,如果你输入了许多没有规律的噪音,或者错误的特征,机器也能学习出非常显著的规律给你,好比根据你早上起床的时间向你推荐今天股票的仓位,将你引入歧途。所谓“Garbage in,garbage out.”放进去的是垃圾,出来的也是垃圾。 许多量化机构都在用机器学习技术,但最终业绩确有很大差异,原因正在于此。选择哪些数据,怎样处理数据,选择哪种学习方法,设定哪种训练模式,这些都直接影响最终的策略质量。数据、方法、模式的组合无穷无尽,真正找到有效组合的机构才拿到了超额的金钥匙。 |
|