分享

解密西蒙斯和文艺复兴科技

 W初九 2016-09-25

1

背景介绍


前段时间看到一个报道,关于2015年收入最高的10大对冲基金经理:



这个榜单中超过半数都是量化对冲基金,其中以西蒙斯和他的文艺复兴科技公司为代表。作为有史以来最成功的对冲基金,自1988成立以来,文艺复兴科技公司的旗舰基金——大奖章基金取得平均每年36%的回报。收益远超巴菲特、索罗斯等同侪。而其创始人、现年78岁高寿的詹姆斯·西蒙斯(James Simons)也被誉为“量化投资之王”,成为传奇人物。据BusinessInsider,在《阿尔法》连续15年的排行榜上,Simons从未缺席,并一直名列前茅。十五年里,他赚了235亿美元。


Simons在23岁拿到数学博士学位,26岁编写代码攻破国家安全局,30岁领导一个大学的数学系,37岁赢得了几何界的最高奖项美国数学协会的Oswald Veblen几何学奖。Simons年近40才“半路出家”,他面对媒体一贯低调,外界对其文艺复兴科技公司知之甚少。其中关于他们最多的猜测是使用了隐马尔可夫模型(HMM),主要依据是他们的主要成员的背景。


首先,核心创始人Leonard Baum是著名的Baum-Welch算法的发明者之一,这是HMM模型用于参数估计的核心算法;其次,复兴科技的另一位初创人物ElwynBerlekamp是一名数学教授,是统计信息方面的专家;后来,复兴科技又陆续引进了世界顶级HMM专家-剑桥大学的数学博士Nick Patterson,以及IBM公司Watson实验室的语音识别专家PeterBrown,Rober Mercer。公司在初期做所招募的这些人才,无一不是运用HMM的高手,这让我们有理由相信他们很大可能在使用HMM相关的算法。



2

理论背景


隐马尔可夫模型(Hidden Markov Model) 是一种统计模型,用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数,然后利用这些参数来作进一步的分析。下图是一个三个状态的隐马尔可夫模型状态转移图,其中X表示隐含状态,y表示可观察的输出,a表示状态转换概率,b表示输出概率。



HMM模型有三个重要的假设:




HMM模型需要解决三类主要问题:

1)评估问题:给定一个观察序列O=O1O2...OT和模型μ={A,B,π},如何快速地计算给定模型μ的条件下,观察序列O=O1O2...OT的概率,即P(O|μ)

2)解码问题:给定一个观察序列O=O1O2...OT和模型μ={A,B,π},如何快速地选择在给定模型μ的条件下在一定意义下”最优“的状态序列O=O1O2...OT,是该状态序列”最好地'解释观察序列?

3)学习问题:给定一个观察序列O=O1O2...OT,如何调整参数μ={A,B,π},使得P(O|M)最大?


针对HMM的三个基本问题,相应的算法是:


1)概率计算问题:前向后向算法


前向算法:



后向算法:




2)解码问题:维特比算法(Viterbi),本质是动态规划



3)学习问题:前向后向算法(Baum-Welch),本质是EM算法





3

策略思路


HMM理论运用到股指期货市场,我们认为市场每一天的涨跌都对应着一个隐含的状态,这个状态可以是牛市,或者熊市,或者震荡等,而每日的价量指标等特征可以表示为隐含状态下的概率分布,简单可以表示成如下关系:



技术面指标选取4个,分别是:

对数收益率(Logreturn),收益率指标,表示价格的变化情况;

平均真实波幅(ATR),波动指标,表示一段时间内的平均波动情况;

乘离率(BIAS),反趋势指标,表示股价偏离均线大小程度的指标;

移动平均成交量(VOSC),成交量指标,表示成交量运行的趋势


训练样本的时间选择从201271日至2015630日,将Logreturn,ATR, BIAS, VOSC4个指标经过标准化处理以后作为观测值输入到HMM模型中,这里假设隐状态数量为3,观测值的概率满足高斯分布。根据Baum-Welch算法迭代计算得到初始状态矩阵π,隐状态转移矩阵A,以及发射概率分布B,再根据Viterbi算法得到隐状态序列的预测值。从结果来看,模型基本区分出了三种不同的状态:



样本外测试时间从201571日到2016525日,每天收盘之后计算当天观测指标的隐状态S和概率似然值P,从历史数据中找出S状态下最接近P10个样本,对它们后一天的收益率取概率加权平均值。如果这个数大于0.2%,给出次日买入信号,若小于-0.2%,给出次日卖出信号,介于二者之间时,空仓。若判断错误,当亏损达到2%的时候止损。



4

测试结果


累计收益率:



收益率时间序列:




最大回撤:




滚动相关性:




VaR敏感性:




策略综合业绩指标:




总体而言,本策略属于高风险高收益的策略,和市场波动呈现明显的负相关性;策略总体胜率在50%左右,并不突出,但因为成功预测了几波大的非趋势性行情,导致拉高了最终的收益率,列举其中几个:








5

后续研究



本文对HMM在股指期货投资中的应用做了初步研究,结果表明该策略有一定的预测性,但是还远没有达到可用于实战交易的要求,具体来说,需要对以下问题进一步分析研究:

1.      参数设置,如隐状态数、观测特征选取、测试时间周期、训练样本的选择等

2.      实际交易过程中的问题,如开盘跳空、价格无法成交、隔夜政策变化等情况都会造成收益的损失,本模型并未考虑这些因素

3.      模型在同一个市场不同周期、不同市场、以及其他品种的有效性




Reference

Radiner LR, Juang B(1986). An introduction of hidden markov models. IEEE ASSP Magazine

Rabiner LR (1989). A Tutorial on Hidden Markov Models and Selected Applications inSpeech Recognition. Proceedings of IEEE, 77(2), 267,295.

各种 Google Scholar,各种网络资源




    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多