分享

「量化危机」PCA、VaR及预测的失灵

 gfergfer 2023-11-20 发布于辽宁


自嗜的量化
钱效应彻底消失的时候,人类选手比机器人至少多了一个选项——选择不玩。量化最大的问题在于——机器学习敷衍地解释历史,机器学习也无效地预测未来——如果没有对手盘兴风作浪,量化便失去了自己的方向。
认知是艰巨的,而有限的基于统计的学习算法的泛滥,让量化行为自然趋同——善用量化方法优势/劣势的自然是少数派,平庸算法的泛滥也是人类技术意志的泛滥,这没什么不同。
当市场在所有方向上都没了合力,题材轮动也失去了流动性的时候,量化交易就成了市场的绝对主流——这就是近期A股的特点——这时候,也是量化互相收割的内卷——肉眼可见的,被动决策的量化开始显露广泛的亏钱效应。
集体大跌的恐慌模式被量化看作机会并买入,可等大家想做合力的时候,量化又极其自觉地开始砸盘——市场的流动性在集体情绪中,就这样被玩没了。
机构投研能力强惯性也大,专注中长期赛道,情绪高手的游资灵活,专注于短期题材,周期性复活的产业融资力量善于利用次新等概念兴风作浪...必须要有多样性的风格博弈,高频的量化机器人才能肆无忌惮地收割流动性。
所以,量化就跟任何技术的市场行为一样,遭遇渗透率的天花板——如果没了风格各异的对手盘,整个市场都是机器人在交易,那岂不是一潭死水?乌托邦也不过如此吧。最终,量化亏钱效应到了极致,便会重新将主动行为的决策权还给人类——贪婪而特异的人类。
从市场行为中,我们能够观察到量化风格的种种不堪。而不管站在支持还是反对的立场上,我们都有理由深入地对其风格来源进行更深入的剖析——从而更多理解我们的对手,抑或是我们得力的助手。

图片

PCA
成分分析PCA,是一种分析大型数据集的数学技术。对于股票、债券或其他金融资产的大型投资组合的历史价格数据使用PCA,可以找一些价格的线性组合——这种组合能够尽最大可能多地解释数据集——这些组合就被称为主成分。

可以使用这些主成分值来可视化数据——在原始数据中做可视化基本是不可能的,因为数据量很大——但是,只需要几个主成分,就可以'准确'地建模数据。

想象三维空间里很多点,每个点都由xyz三个维度来表示,或许你突然间发现,大部分的点都落在一个二维平面上,或者离这个平面非常近的空间位置上。于是,你可以把所有的点都投影到这个二维平面,并用两个维度——x和y来表达所有点的位置。当你这么做的时候,你就是在做主成分分析PCA。

PCA是一种数学变换,它将数据的维数减少到一组较小的不相关维度,称为主成分(PCs),这样做的基本思想是:低维度超平面的向量(数据的低维投影)反映了数据的潜在结构——显然,对于没有任何结构的数据,主成分PC应该都是完全相等的。

PCA的使用者通常有个隐含的期望:主成分的方差通常提供了完整数据集的结构性信息——当方差的差异很小时,往往很难体现出数据的结构信息。

图片

一般(高斯)情形下,对于没有任何结构的数据,如果没有足够多的样本,我们会认为数据中有隐藏的结构信息,如果样本足够充分,那么结构往往趋于平坦——随着n增加,我们可以看到具有高斯分布的更平坦的PCA结构。

PCA方法在科学中有许多应用——仅在群体遗传学中,PCA的使用就有十几种标准应用——这还没算量化金融和分子动力学等领域的丰富应用场景。

对于金融量化专家来说,如果要在大型数据集的不同部分获取重复性的信息,PCA方法是个很好的工具——尤其是一项资产的历史价格可能与另一项资产历史价格类似的情况下。
比如,20年期债券收益率可能与30年期债券的收益率相近。这时的线性回归等其他传统统计技术可能会失败——因为它们混淆了类似的资产价格或收益率。相比之下,PCA提供了一些价格或收益率组合,并可以解释大部分的数据。PCA对降低数据集复杂性非常有用——利用这项技术,可以快速计算投资组合的风险。
PCA可应用于收益率曲线,并用来做预测,因为债券不同期限的利率高度相关。3个月收益率几乎总是最低的,20年收益率几乎总是最高的。就收益率曲线而言,因为利率对整个经济运行都非常重要,人们甚至考虑用它来预测股票指数的回报。
这样做的原因在于,由于PCA降低了数据矩阵的维数,因此可以使用比正常线性回归模型少得多的预测变量。
此外,PCA还可以用来对近似的资产进行分类。
然而,美丽的应用外衣下,这项技术却存在着一个巨大的基础理论缺陷:
PCA的结果是数据的“虚影”,人们可以容易地操纵数据以产生期望的结果——PCA的这一类似“黑匣子”的特点让“事后诸葛亮”、“循环论证”、“过度拟合”等认知偏差趁机溜进来并肆意妄为。这种人为的数据操纵就像是说,伦敦和纽约之间的直线距离,由火星在太阳系里的的位置来决定一样荒谬——或者换做更现实的说法:除了经济危机发生的期间,PCA方法都运作的很好。

换做学术一点的说法就是:PCA的结果通常依赖预先存在的知识进行解释——PCA在后验中是无信息的。

最近,PCA的问题还得到了Nature的重点关注,2022年的一篇名为《Principal Component Analyses(PCA)‑based findings in population genetic studies are highly biased and must be reevaluated》的文章写到:PCA分析可能在基因研究中具有偏倚作用,应重新评估此前所发表的32000-216000项基因研究论文。

另外,更重要的是,Taleb还告诉我们,在肥尾分布的情形下,PCA还会进一步地失真——通常我们认为相关性为0时,主成分相互独立,但在肥尾下,相关性为0并不能推导出相互独立。
图片
肥尾下的情况,与高斯情形略有不同——即便数据毫无结构可言,主成分之间的差异也非常大——即便样本量不断增加,这种差异性也没有明显的改善,这会严重地误导我们的判断。

小样本效应导致有序的PCA显示出下降的斜率,对于厚尾,需要更多的数据来消除虚假的相关性——这意味着PCA降维技术不适合肥尾。
就像均值估计在肥尾下会带来统计的失真一样,我们会被小样本效应误导。因此,在肥尾环境下,PCA需要被一个矫正指标来替代——就像我们在肥尾情境下,需要用MAD平均绝对偏差代替STD标准差一样,更稳健地来表达数据的波动。
作为一个经验总结,总体说来,类似PCA这种基于“相关性”来表达信息的方法,通常都劣于基于“”(比如微分熵)这一概念的数学方法。因此,考虑到它的局限性,量化领域应该时刻慎用这一思想和工具。

图片
VaR
融文献中的投资组合选择基本上是在两个中心假设下进行分析的:
  • 完全了解构成目标投资组合的证券收益的联合概率分布

  • 通过效用函数来表达投资者的偏好

在现实世界中,运营商在风险约束下构建投资组合,风险约束由其客户和监管机构给出,并需要承担在给定的信心水平下在给定时间段内可能产生的最大损失(所谓头寸的风险价值)——这就是VaR的应用背景。

从数学上讲,VaR被定义为投资组合在特定的置信水平下在特定的时间范围内经历的最大损失——这被看做投资组合未被管理的N天内损失金额X的概率——如果要正确指定VaR,需要提前给出给出时间长度N(通常以天为单位)和显著性水平α。
如果管理的是政府债券,N可能只是一天;如果管理的是交易频率较低的工具或公司贷款,N可能长达一年。
有时,VaR被写成VaR^α,置信水平用上标α表示。显著性水平α也取决于计算VaR的目的——银行监管机构希望确保其银行不会遇到问题,因此他们通常指定α=0.01。如果你在交易层面使用,则α=0.05可能更合适。
VaR通常被引用为正数——即使它指的是损失。有些人使用α的一个替代方法:用1–α来理解α。1–α的意义是损失不会比VaR更严重的置信水平。例如,如果α=0.01,则有99%的信心认为,你的损失会小于VaR。
金融风险通常通过波动性来量化——这离的波动性将资产收益的平方相加,然后取平均值,而不管收益是正还是负。同时,波动率是与收益的正态或高斯分布密切相关的参数。
我们可以量化市场价格变化或波动对投资组合的影响,来评估风险。大多数大型机构持有许多不同的金融工具,这些金融工具的特征也不可能完全相同——而采用VaR的一大好处是,无论资产是什么,它都提供一个单一的数字结果,从而简化了风险监控。
因此,VaR可以计算利率衍生品、债券或期货合约的风险。此外,VaR的另一个关键应用,是由银行监管机构确定银行必须持有多少资本来承担风险。
可以对产品和货币的VaR进行汇总——用于将影响你感兴趣的风险因素累加起来,以给出机构头寸风险的总体度量——在监管者看来,这一方法尤其重要,因为人们相信,多样化是降低风险的关键途径之一。对此,VaR提供了一种监控大型多样化金融工具组合的好方法。
VaR承载了美好的期望,但事与愿违的是,自1987年首次使用以来,VaR和“现代”投资组合理论一直在毁灭基金和银行:
1987 年,它毁灭了芝加哥的First Op,1998年,它毁灭了 LTCM,2009年,它毁灭了 FNMAe 和几乎所有银行,2020年,它毁灭了AQR,然而,至今它仍在使用中。

VaR是导致2008年的次贷危机的一个重要原因——它直观的给出了一个公式:违约概率 x(1-预期可回收率),但这可能与违约情况下的实际损失预期大不相同。

错误在于,金融衍生品设计者将可回收率计算为抵押品的预期价值,而不受违约事件本身的影响,而违约附带条件的抵押品的预期价值往往远低于其无条件的预期。2007年,经过一系列大规模的止赎,大部分抵押物的价值下降到其预期价值的1/3左右!危机爆发。

讽刺的是,发明风险价值(VaR)度量的初衷,是试图回答这样一个问题:事情会变得多糟?VaR被许多金融机构广泛用于内部风险管理,多年来一直是金融监管的一部分。
金融机构(如银行)可以通过多种方式控制风险。最重要的是通过对冲——一种为了防止不利的价格变动而进行的交易。
然而,2007年,来自华尔街的摩根斯坦利就陷入了麻烦。他们试图非线性的市场里试图取得成功——工具就是对冲。更具体地说,他们想要'对冲'房地产的'崩溃'。在房地产步入衰败之前,摩根斯坦利并没有意识到——“崩溃”不是一种二元的结果,崩溃可以被量化为很多的值——当中有一些会比预想的更差。
如果轻微的衰退,摩根能够获利,如果跌的很惨,他们就会倒霉。这种情况是无法通过VaR的方式来解释的——最终,我们看到摩根斯坦利正确地预测了危机,但却从“对冲”操作当中损失了100亿美元。
极端事件可能导致对波动性的错误估计。如果你用一个简单的移动平均值计算波动率,并漏掉最近的一些重大损失,那么你可能严重低估了风险。
如今,国际清算银行巴塞尔委员会就风险价值,做出了优化,考虑了极值理论并从保险业借鉴更多的经验,如今的监管在VaR基础上,还体现了压力测试(使用极端波动时期的数据计算VaR,也被称为SVaR,主要用来避免对风险价值进行顺周期估计,避免在市场过度自信的阶段评估)、止损(一种强制性指令,它试图在触发时终止全部或部分风险敞口,即某种预先定义的名义损失)、期望缺口Expedted Shortfall(即损失超过VaR的预期损失,也称为CVaR)等。
但在批评者看来在,这样的改良仍然存在问题,其本质在于,用方差代替风险的想法对冒险的实践者来说可能显得很奇怪。
现代投资组合理论降低方差的目的与理性投资者的偏好不符——无论其风险厌恶程度如何,这种做法也同时将利润最小化了——除非应用在对未来平均回报的确定性非常低的情况下,以及在投资者只能投资于具有对称概率分布和/或只有对称收益的情况下——但这样的前提也无形中削弱了工具本身的力量。

图片
价格预测
易员根据历史价格数据,可以构建许多不同的指标。一些指标使用一段时间的收盘价,有的使用了高点和低点价格,还有其他人使用交易量。
世界各地的股票市场通常提供每个交易日的开盘、高、低、收盘和成交量数据。这个数据集非常丰富——交易量告诉你一天内有多少股票被交易,并可能表明价格变化的相关性。如果价格开始以特别高的成交量上涨,原因是一些交易者有很强的信念,并且正在大量买入。这一上涨可能是一个很好的指标,表明价格将进一步上涨。
还有人发明了一些复合指标,比如动量——一种可以将其视为市场趋势的指标。存在许多动量指标,也没有精确一致的定义,但它们都可以告诉我们市场是上涨还是下跌。然而,当市场一天一天、甚至一小时一小时地波动时,这种尝试并不容易。
最简单的动量指标是一段时间内的价格变化。例如,今天的价格减去20天前的价格是动量指标。如果价格呈上升趋势,那么这个数字是正的,即使明天价格下跌,也可能是正的。只有当价格大幅下跌时,趋势才会逆转。同样,如果价格呈下降趋势,则该指标为负,只有在价格大幅上涨时才转为正。
这种仅基于两种价格的简单动量指标过于简化因此不够稳健,也可以利用指数加权移动平均(EWMA)来创建历史价格的平均值,其中更大的权重被赋予最近的价格。
通过减去两个EWMA创建的动量指标可以得到振荡指标——因为它根据价格趋势是上涨还是下跌可以在正值和负值之间切换。
如果价格趋势确实很明显,则可以通过两个EWMA计算出的动量振荡在某种程度上预测未来价格。这个振荡器也被称为MACD指标——移动平均收敛/发散。
动量指标外,还有很多其它选择,比如相对强度。相对强度是根据过去n天的价格上涨总变化U和过去n天价格下跌总变化D来计算的——相对强度由方程RS=U/D定义。相对强度指数(RSI)比RS更方便使用——RSI是一个介于0和100之间的数字。如果RS较大,因为价格几乎没有向下移动,那么RSI几乎等于100。相反,如果RS较小,因为价格很少向上移动,则RSI将接近0。
这一事实使RSI成为价格变化背后动量的表达指标——0表示弱势,100表示强势。如果RSI很高,比如超过80,这个水平被称为超买,价格被认为可能下跌;如果RSI很低,比如低于20,你认为它是超卖,价格可能会上涨——自然,这种看法又回到了迂腐的回归期望,这明显与反身性的波动理解是矛盾的。
还有一类随机指标,流行的随机指标类似于相对强度和动量指标。不同之处只在于它使用每日价格的高值和低值,这有助于评估最近的价格是否突破了某个阈值——是否超越了近期的最高点或最低点。
尽管方法众多,但请记住,任何技术指标都是反身性指标——资产价格与交易行为之间存在反身性,技术指标和交易行为之间也存在反身性,金融市场是一个博弈的市场,任何指标都是动态调整的,而不是铁板一块——基于过去的信息都不能准确地预测未来。
动量指标存在自身的局限性,相比之下,静态的量化方法更加显得过时——比如夏普比率,最大回撤,乃至alpha/beta这些耳熟能详指标的效力只会更差——很多情况下,夏普比率没有意义,最大回撤也并不是越小越好,这两个概念都是非博弈均衡体系下,风险和收益对等认知下的过时概念,难以适应动态运行的金融市场。

由于反身性的巨大效力,如今市场上大部分的投资研究体系,都可以看作是是互相验证,互相成全的心理游戏,比如牛熊周期的宏观假设往往成为心理预期的基准,与此同时,个体也会有心理的摇摆,并在市场中试图通过实践反馈去印证某种信仰或是否定它。

即便现代的机器学习方法的万能近似定理能够很好的拟合商业世界里的非线性(比如一系列ReLu函数期望的和),这项技术可以以任意的精度拟合任意复杂度的函数。但这一技术显然也是滞后于博弈的——过拟合是常态,它无法做出'更好的预测'。
与其预测价格的走势,倒不如说,机器学习的优势是发现特定交易者的行为模式,并针对这些模式进行针对性的套利。
我们目前能做到的最好,也仅仅是对于博弈行为己结果观察的统计描述——众多买入卖出的决策者的操作行为可以在实践维度和价格维度上留下印记,即更一般的模式——比如人们接收到市场信息后,达成共识需要一定时间,对于外部信息的反应,人类行为在时间和规模上存在强阵发弱记忆的特性——简单来说,就是会在一个较短的时间内,大量的人同时决策,呈现阵发效应,阵发过后,又趋于平静(这也可以被解释为幂律或分形的特点)。
上大多数的'生意'的收益都是不可预测的,因此,试图通过众多技术方法利用各种技术指标,单纯地在概率上对未来预测进行校准,注定是徒劳和毫无意义的。
Taleb还告诉我们,风险来自肥尾的现实,就像是个黑箱子,知识的局限性约束了我们对于未知肥尾的理解。虽然风险无法直接窥见,但我们可以适当变通,对肥尾施加部分的控制,并让某些肥尾的情况转化为薄尾分布或有界分布。
数学上可以证明,左凸右凹的函数可以将肥尾转化为薄尾分布,Sigmoid函数可以将肥尾转化为有界的反正弦分布。
这意味着概率的原始认知,可以通过有效的控制转化为受控的薄尾认知——即损益。而这一处理的成功关键,就是条件式地寻找可转换的情形——这与寻找凸性具有重要的关联,也是Taleb的反脆弱观点。
损益的度量是针对回报(业绩的累积表现)而言的,更加接近真实世界的情况,因此它往往比量化金融的投注记录(计数型)和Brier Score(记分型)这种关注频率的指标更加有效。
单纯的被动观察和解释,回测的立场,是概率计算的单向思维,在风险的世界中套利,这种认知是不完整的。更好的方向是,我们需要兼顾了认知和行动的 ,加入更加主动的反脆弱凸变换,嵌入反身性,从博弈和赔付的角度,动态地理解风险。
这种凸性不是诸如单向止损的鸡肋策略,而是更加本质的社会观察,来自博弈行为,制度安排,市场心理等更为基本的定性认知,这种认知最好不会随着时间的流逝而变得过时。
量化的未来方向,应该发明更多的凸性金融衍生工具择机而动(期权丰富的衍生品在这方面做出了很好的示范作用),而不是概率方法拟合的模式识别和预测工具,后者是一种简化认知的蛮力思维,妄图通过速度和算力来弥补先天的认知黑洞,这条路注定会越走越窄。

图片
总结
PCA,VaR,价格预测,只是量化应用例举的三个视角,量化的应用远远不止于这三个维度,在债券,货币,期权,期货等不同的市场中,或不同的风险偏好和风险目标决定的应用领域,量化都有着独特的工具和方法。
如果市场真的有效,那么就没有人能够套利,就没有人去有动机研究不同的交易策略,并发展出量化的技术和风格。因此,量化的存在,以及多样风格的存在本身,就意味着市场是不均衡的。
技术的创新不会停止,但我们需要具备基本的分辨力,来对技术进化正确的方向进行判断,做出正确的选择,从而避免陷入自卷的尴尬境地——新技术总是被看做颠覆旧体系的高大上的事物,但我们更应该深入地理解量化当前所存在的问题,尤其是技术本身所带来的,先天痼疾的缺陷,或许从技术批判中,我们更能获取深刻的理解,来解决有关未来的难题。

参考资料

Eran Elhaik.Principal Component Analyses (PCA)‐based findings in population genetic studies are highly biased[M].Nature,2022
Nassim Nicholas Taleb.Statistical Consequences of Fat Tails:Real World Preasymptotics, Epistemology, and Applications Papers and Commentary[M].STEM Academic Press,2020
Nassim Nicholas Taleb,Pierre Zalloua,Dan Platt.Informational Rescaling of PCA Maps with Application to Genetics[M],2019
Steve Bell.Quantitative Finance for dummies[M].John Wiley&Sons, 2016

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多