作者:周常欣
说起我与量化投资的结缘,就不得不说几年前我在啃HMM(隐马尔可夫模型),多之所以啃这个模型,是因为目前语音识别的算法里,HMM算法是效果最好的一个。我下载了美国贝尔实验室劳伦斯拉宾纳的英文版教程《Fundamentals
of Sppech
Recognition》,其中第六章系统地解了隐马尔可夫模型的原理和应用,国内大多书籍里关于隐马尔可夫模型的资料都是翻译了这一章。
隐马尔可夫模型的核心算法之一是Baum
Welch算法。最后确定模型参数时要用到EM算法,这些算法比较难啃。正好学校买了读秀的图书资源,我得知后,第一件事就是在读秀资源上搜索“HMM
隐马尔可夫模型”的关键词,搜到《解密复兴科技基于隐蔽马尔科夫模型的时序分析方法》的书,我看到书名就在想:这个HMM和复兴科技有啥关系?复兴科技又是个什么鬼?带着疑问,我开始阅读这书。
复兴科技的创始人数学家James
Simons(西蒙斯)是一位赫赫有名的数学大师,最初在美国国防研究院供职,看了《时代周刊》上关于越南战争的残酷报道之后,西蒙斯给《新闻周刊》写信说应该结束战争,并把反战的想法告诉了老板,也因此被解雇。牛人西蒙斯一气之下,带领着一帮数学家、物理学家进入了金融界,与市场进行博弈。1994年到2004年中期的年化收益高达71.8%,在全球金融危机的2008年,大部分对冲基金都亏损,而大奖章的return高达98.2%。由这些天才般的数学家和物理学家以及一些超强的交易员构成的文艺复兴科技和他们创建的神秘的大奖章基金,不禁让外界猜测,他们究竟是搭建了一个怎样的量化模型,才能用非绝对投机的方法战胜市场呢?
据大量专家分析,隐马尔可夫模型(HMM)也被认为是他们最有可能运用的一个模型。为何?
第一个理由:复兴科技成立初期的创始人中有一位James的好朋友Lenny Baum,此人正是发明广泛应用在语音识别等领域的Baum
Welch算法的那个Baum(隐马尔可夫模型算法第三步的核心算法:Baum-welsh)算法是用来确定隐式马尔可夫模型中未知变量可能出现的概率。
第二个理由:1993年加盟复兴技术的剑桥大学数学博士尼可·帕特森就是全球HMM领域公认的专家。另外,James还雇了很多曾在IBM从事语音识别和自然语言处理的科学家来复兴科技工作。以这些人的机器学习和文字信息处理的功底。
从这两个理由,很难不引人猜测复兴科技出奇制胜的法宝便是:隐马尔可夫模型(HMM)。
西蒙斯的干将主要来自三个地方:一是石溪大学的数学系,过去他曾是系主任,打造成了全美名列前茅的数学系;一个是老东家国防分析研究院;另一个地方令人备感惊奇,即IBM公司的语音识别实验室,有人曾说,当年西蒙斯把整个语音识别实验室的精英统统都挖走了。
对西蒙斯的量化投资的理念理解的第一重境界:
很多人曾问西蒙斯,为什么要搜罗世界上最优秀的识音识别专家从事金融研究。他回答道:“投资和语音识别很相似,投资界的人都要看股市或外汇市场等曲线,股市最经典的理论之一是波浪理论,也就是把股市曲线看成波形。我们在中学学物理时,也知道波音的本质也是一种波形。投资和语音识别都是要预测下一点发生的事情。通过模型来学习前面的波之后,然后做预测未来。也许你会觉得这太不可思议了!怎么可能可以预测未来。
事实上,我们语音识别的应用在我们身边很普遍了,我们经常用的微信就嵌入了语音识别功能。我们可以通过微信录音后识别出文字。这个语音识别模型的工作原理是:通过学习一大量语音的波形特征,得到有用的知识,就像婴儿生下来啥也不懂,通过学习,得到知识一样。以后遇到不知道的声音,但可以通过语音识别模型识别出来,这就是预知未来。
同样,如果将语音识别的理论应用于经融界,我们同样可以学习以往的实盘数据,然后预测未来市场走向,从而获利。
我因HMM与量化投资开始结缘,接下来,我阅读了美国经济学家里什·纳兰的著作:《打开量化投资的黑箱》;丁鹏的《量化投资——策略与技术》一书;金斯伯格的《问道量化投资(用MATLAB来敲门)》;美国伯顿的著作《对冲基金猎人》等书籍。对西蒙斯的量化投资有了更深入的理解。
对西蒙斯的量化投资的理念理解的第二重境界:
与巴菲特价值投资买入并长期持有的理念不同,西蒙斯不败的神话主要得益于其“壁虎式投资法”,所谓“壁虎式投资法”,是指在投资时进行短线方向性预测,依靠交易很多品种、在短期做出大量的交易来获利。用西蒙斯的话说,交易“要像壁虎一样,平时趴在墙上一动不动,蚊子一旦出现就迅速将其吃掉,然后恢复平静,等待下一个机会。”
西蒙斯曾把自已的投资风格与巴菲特比较,说自己是粗放耕种。“在大片麦田中央放一个喷水管即可,每一根麦穗看起来不是特别好,但整体收成又不太差,靠数量取胜。而巴菲特则是密集精耕,他的麦穗不多,但每一根都是精品。”
“我们的投资方法正好是两个极端。”西蒙斯说。
对量化投资感兴趣的朋友们,要学的知识也是挺多的,除了对投资组合管理、无套利定价原理、高频交易策略、统计套利策略、阿尔法回报、阿尔法模型、风险控制模型、交易成本模型、投资组合构建模型、均值回复策略、趋势跟随策略、价值型投资策略、基本面分析、技术判断法、技术量化法、
所谓“壁虎式投资法”,是指在投资时进行短线方向性预测,依靠交易很多品种、在短期做出大量的交易来获利。用西蒙斯的话说,交易“要像壁虎一样,平时趴在墙上一动不动,蚊子一旦出现就迅速将其吃掉,然后恢复平静,等待下一个机会。”
西蒙斯的方法多是进行短线方向性预测,依靠同时交易很多品种、在短期作出大量的交易来获利。具体到每一个交易的亏损,由于会在很短的时间内平仓,因此损失不会很大;而数千次交易之后,只要盈利交易多余亏损交易,总体交易结果就是盈利的。
对西蒙斯的量化投资的理念理解的第三重境界:
西蒙斯的大奖章基金的投资产品必须符合三个标准:公开交易品种、流动性足够高、适合用数学模型来交易。而要符合第三个条件,该交易品种必须有充分的可以进行分析的历史价格、交易量等数据,从而找出最适合的交易模型来进行量化投资。西蒙斯认为,数学模型可以降低投资人的风险和所需承受的各种心理压力,因为模型没有感情,一旦选定就会自动执行,能够克服人性在市场面前暴露出来的弱点。
科学研究生涯对西蒙斯的量化交易策略产生了影响。他提起了观察核子加速器试验给他带来的启发:“当 2
个高速运行的原子剧烈碰撞后,会迸射出数量巨大的粒子。我注视着电脑屏幕上粒子碰撞后形成的轨迹图,它们看似杂乱无章,实际上却存在着内在的规律,这让我自然联想到了证券市场,那些很小的交易,哪怕是只有
100 股的交易,都会对这个庞大的市场产生影响,而每天都会有成千上万这样的交易发生。”
基于这样的观察,西蒙斯是通过捕捉市场大量异常瞬间机会来赚钱。“有效市场假说是基本正确的,也就是说,市场没有什么明显的套利机会。但是,我们关注的是那些很小的机会,它们可能转瞬即逝。这些机会出现之后我们会做出预测,然后进行相应的交易。交易之后,我们又会对新的市场情况进行跟踪和评判,预测也会相应调整,投资组合也会跟着变化。我们总是不停地买入、抛出。我们之所以赚钱,就是靠我们不停地交易。”
从技术角度来说高频交易的核心是从数理模式转换过来的策略自适应算法,各公司有所不同,随着环境的变化,以及竞争的加剧,版本可以升级。它使用市场的滴答数据录入,调整由动态数学公式+先验概率判决+统计推理组成的量化模式,这种数理模式,从信号处理角度来说是数字滤波器;从软件角度来说是自适应算法。
高频交易类似高速运动的粒子,利用马尔科夫过程对看似杂乱无章的运动进行分析,得出其规律。马尔科夫时间序列分析模型广泛应用于信息通讯、计算机科学、生物遗传学、金融学、经济学等领域。运用最大似然无偏估计线性回归的方法,研究股价在运行过程的截距和斜率,也就是研究股价运行的动力学特征,实际上就是强度。运用马尔科夫模型研究股指的收益率特征,并以此用以判定牛熊分界,为基金提供择时参考。运用赫斯特指数研究投资品种的波动率牲,用于指导资金管理、风险控制。
西蒙斯充分证明了数学的魅力、计量经济的严谨和金融市场的奥密。
以上仅是个人愚见,抛砖引玉,还请各专家多批评指正!
【本文由“量化投资”发布,2017年9月2日】
|