1 背景介绍 前段时间看到一个报道,关于2015年收入最高的10大对冲基金经理: 这个榜单中超过半数都是量化对冲基金,其中以西蒙斯和他的文艺复兴科技公司为代表。作为有史以来最成功的对冲基金,自1988成立以来,文艺复兴科技公司的旗舰基金——大奖章基金取得平均每年36%的回报。收益远超巴菲特、索罗斯等同侪。而其创始人、现年78岁高寿的詹姆斯·西蒙斯(James Simons)也被誉为“量化投资之王”,成为传奇人物。据BusinessInsider,在《阿尔法》连续15年的排行榜上,Simons从未缺席,并一直名列前茅。十五年里,他赚了235亿美元。 Simons在23岁拿到数学博士学位,26岁编写代码攻破国家安全局,30岁领导一个大学的数学系,37岁赢得了几何界的最高奖项美国数学协会的Oswald Veblen几何学奖。Simons年近40才“半路出家”,他面对媒体一贯低调,外界对其文艺复兴科技公司知之甚少。其中关于他们最多的猜测是使用了隐马尔可夫模型(HMM),主要依据是他们的主要成员的背景。 首先,核心创始人Leonard Baum是著名的Baum-Welch算法的发明者之一,这是HMM模型用于参数估计的核心算法;其次,复兴科技的另一位初创人物ElwynBerlekamp是一名数学教授,是统计信息方面的专家;后来,复兴科技又陆续引进了世界顶级HMM专家-剑桥大学的数学博士Nick Patterson,以及IBM公司Watson实验室的语音识别专家PeterBrown,Rober Mercer。公司在初期做所招募的这些人才,无一不是运用HMM的高手,这让我们有理由相信他们很大可能在使用HMM相关的算法。 2 理论背景 隐马尔可夫模型(Hidden Markov Model) 是一种统计模型,用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数,然后利用这些参数来作进一步的分析。下图是一个三个状态的隐马尔可夫模型状态转移图,其中X表示隐含状态,y表示可观察的输出,a表示状态转换概率,b表示输出概率。 HMM模型有三个重要的假设: HMM模型需要解决三类主要问题: (1)评估问题:给定一个观察序列O=O1O2...OT和模型μ={A,B,π},如何快速地计算给定模型μ的条件下,观察序列O=O1O2...OT的概率,即P(O|μ)? (2)解码问题:给定一个观察序列O=O1O2...OT和模型μ={A,B,π},如何快速地选择在给定模型μ的条件下在一定意义下”最优“的状态序列O=O1O2...OT,是该状态序列”最好地'解释观察序列? (3)学习问题:给定一个观察序列O=O1O2...OT,如何调整参数μ={A,B,π},使得P(O|M)最大? 针对HMM的三个基本问题,相应的算法是: (1)概率计算问题:前向后向算法 前向算法: 后向算法: (2)解码问题:维特比算法(Viterbi),本质是动态规划 (3)学习问题:前向后向算法(Baum-Welch),本质是EM算法 3 策略思路 将HMM理论运用到股指期货市场,我们认为市场每一天的涨跌都对应着一个隐含的状态,这个状态可以是“牛市”,或者“熊市”,或者“震荡”等,而每日的价量指标等特征可以表示为隐含状态下的概率分布,简单可以表示成如下关系: 技术面指标选取4个,分别是: 对数收益率(Logreturn),收益率指标,表示价格的变化情况; 平均真实波幅(ATR),波动指标,表示一段时间内的平均波动情况; 乘离率(BIAS),反趋势指标,表示股价偏离均线大小程度的指标; 移动平均成交量(VOSC),成交量指标,表示成交量运行的趋势 训练样本的时间选择从2012年7月1日至2015年6月30日,将Logreturn,ATR, BIAS, VOSC这4个指标经过标准化处理以后作为观测值输入到HMM模型中,这里假设隐状态数量为3,观测值的概率满足高斯分布。根据Baum-Welch算法迭代计算得到初始状态矩阵π,隐状态转移矩阵A,以及发射概率分布B,再根据Viterbi算法得到隐状态序列的预测值。从结果来看,模型基本区分出了三种不同的状态: 样本外测试时间从2015年7月1日到2016年5月25日,每天收盘之后计算当天观测指标的隐状态S和概率似然值P,从历史数据中找出S状态下最接近P的10个样本,对它们后一天的收益率取概率加权平均值。如果这个数大于0.2%,给出次日“买入”信号,若小于-0.2%,给出次日“卖出”信号,介于二者之间时,空仓。若判断错误,当亏损达到2%的时候止损。 4 测试结果 累计收益率: 收益率时间序列: 最大回撤: 滚动相关性: VaR敏感性: 策略综合业绩指标: 总体而言,本策略属于高风险高收益的策略,和市场波动呈现明显的负相关性;策略总体胜率在50%左右,并不突出,但因为成功预测了几波大的非趋势性行情,导致拉高了最终的收益率,列举其中几个: 5 后续研究 本文对HMM在股指期货投资中的应用做了初步研究,结果表明该策略有一定的预测性,但是还远没有达到可用于实战交易的要求,具体来说,需要对以下问题进一步分析研究: 1. 参数设置,如隐状态数、观测特征选取、测试时间周期、训练样本的选择等 2. 实际交易过程中的问题,如开盘跳空、价格无法成交、隔夜政策变化等情况都会造成收益的损失,本模型并未考虑这些因素 3. 模型在同一个市场不同周期、不同市场、以及其他品种的有效性
|
|