分享

股票因子投资初探__因子学习笔记汇总

 耐心是金 2022-02-04

本文内容非常长,作者花了两个月整理而成,需耐心阅读。

本文是从“因子角度理解股票投资',阅读书籍《因子投资方法与实践》同时阅读网上各优秀文章而做的学习笔记。其中红色标注重点关注。

内容可能有错误不足之处,以理解思路,逻辑为重点。

******

正文

质量,价值,低波

质量,低波,价值

质量,低波,价值是目前为止实证年化复合收益率最高的因子。

因子投资【factor investing】

因子定义:

“穿透”资产,探寻资产背后“因子”的逻辑。寻找能够解释并且影响资产风险和收益的那些“特征”。

类似众多食物中主要成分蛋白质、脂肪和碳水化合物,维生素C等 

因子描述了众多资产共同暴露的某种系统风险,是资产收益率背后驱动力,因子收益正是该系统风险风险溢价或风险补偿,人认识各种偏差以及套利限制。

因子的背后逻辑:人性的弱点,认识的局限性,风险厌恶的风险补尝。

****

因子的选择必须有深刻逻辑支撑,必须能被'风险补偿','错误定价'两方面得到解释。

技术类因子

动量因子:

背后逻辑:个人投资者更倾向于卖出已盈利投资来锁定收益,并且持有已亏损投资希望其反弹。这使得过去表现较好的股票被低估,过去表现较差的股票被高估。机构投资者作为套利者由于受到做空限制,更倾向于买入过去表现较好的股票进行套利,从而使得强者恒强的效应愈发明显。

因子构成:

强者恒强弱者恒弱,使用过去12个月(剔除最近1个月)收益,获取动量溢价。过去两年(扣除最近1 个月)的对数收益率的加权平均。

动量因子:从历史来看一直是A股上有效的投资策略,即买入前期的涨幅大的“赢家”,卖出前期跌幅大的“输家”,是经典的市场异象。

***

BETA因子:

股票收益率与市场因子收益率构建CAPM后的回归系数,即股票对于市场风险溢价的补偿,在A股历史上表现最为显著的风险因子。宏观角度,这主要得益于中国经济与资本市场的快速发展,与市场所关联的企业均获得良好的溢价从而形成较好的表现;从微观而言,高BETA公司承担更多由市场带来的波动,因此需要给予投资者更高的溢价。



***

流动性因子:

流动性因子(英文名称为Liquidity),但实际上衡量股票的换手率。从该因子收益率的表现来看,高流动性的股票持续获得折价,相反低换手率的股票相对于高流动则持续获得溢价。从理论上而言,换手率低的因子承担较高的流动性风险,因此理应承担更高的风险溢价,但是从实际的投资策略而言,交易流动性低的股票常常伴随产生较大的市场冲击成本,因此很难通过高配低换手率的股票获得超额收益。
1/3 近21 交易日 + 1/3 近63 交易日 + 1/3 近252 交易日 平均换手率的自然对数。

规模因子:ln(流通市值)。

非线性规模因子:非线性规模因子是规模因子的3 次方,然后经过施密特正交化处理,以去掉共线性的部分,非线性规模因子主要强调市值中等的股票。

负相关性因子。

**

波动因子(BAB):

波动因子,也称赌贝塔因子,定义为低贝塔股票-高贝塔股票所构成的多空组合。

背后逻辑:由于投资者常常受到杠杆限制,不能自由增加杠杆,因此,他们更偏好买入高贝塔股票来变相给市场组合增加杠杆。这种行为使得高贝塔股票的价格被高估,由于套利者的存在,导致了更低的平均收益。

**

波动率(全称为残差波动率,英文名称为Residual Volatility)由股价的波动率与CAPM的残差性合成而得。从历史来看残差波动率因子折价显著,这表明投资者对于波动与不确定性的厌恶。反过来理解,就是基于低波动股票更高的溢价,表明投资者对于信息确定性的需求。

最小波动率指数:

该指数主要依据最小方差优化法来构建,用来捕捉低波动股票组合带来的超额收益。历史数据显示,它在弱宏观环境下有更好表现,属于防御大类指数。

残差波动率因子计算方法:
计算beta 因子时的残差序列的标准差。

**

反转因子:最近一月收益率。

**

市场因子(MKT):

背后的逻辑是股票相对于短期国库券拥有正溢价。

是股票-短期国库券所构成的多空组合,是人们发现的第一个因子。

**

市值因子:

背后的逻辑:小市值股票所隐含的经营风险大于大市值股票经营风险导致了持有小市值股票的人需要更高的风险补偿 风险溢价。

规模小的公司长期明显跑赢规模大的公司,用市值等指标衡量公司规模,可以获得小市值溢价。

市值因子(Size)和市场的表现是负相关性。也就是说,过去10年小市值股票远远跑赢大盘。另一个有显著负相关性的因子是流动性因子(liquidity),意味着如果做多流动性好的股票,做空流动性差的股票,最终会取得较大的负收益。

市值因子被公认为对组合影响最为显著的风险因子,通常来说,量化投资者通常以控制行业暴露与市值暴露为风险控制第一原则,目的就是为了防止风格切换导致组合的超额收益下坠。简单来说,市值因子就是同时买入大市值股票与卖出小市值股票构建的理论组合。

在壳资源与主题、概念、垃圾股投资盛行的年代,A股市场曾经一度以小市值为主,量化投资者也仅需要暴露小市值股票便可旱涝保收。由于监管的倡导与机构投资的参与度增加,小市值反转的行情在2016年开始。从统计上而言,盈利与市值因子有较高的线性相关关系

**

基本面因子

价值因子:

上市公司账面/市值的比值,与盈利因子表现相似,在2015年股灾之前,低估值股票产生相较于高估值股票产生折价。究其原因,估值低的股票同时隐含了成长低的假设,而在中国的投资环境中,投资者更愿意给予成长性溢价。


背后逻辑是低估值股票在宏观经济较差时隐含的风险远高于高估值股票,但在宏观经济较好时隐含的风险仅仅略高于高估值股票。因此,总体来看,低估值股票隐含的风险较大,需要更高的风险补偿。

由于低估值股票所对应的上市公司通常拥有较多的非生产性资本(例如固定资产)。非生产性资本在宏观经济较差时会成为企业的负担;而在经济较好时,由于资本扩张较为容易,这种非生产性资本转换为生产性资本带来的优势也有限。

由于便宜的股票长期强于高估的股票,利用PB、PE和EBITDA/EV等估值指标,捕获价值溢价。

P/E高的就是贵价股(往往被市场预期为高成长性)P/E低的就是价值股。

****

价值因子哪个估值指标最好?

价值因子的每个估值指标收益比较:

成长股(组1)的年化收益率为7.67%,而价值股(组10)的年化收益率为14.78%,

成长股(即高估值股票)中,不管用什么估值指标,其年化收益均低于同期市场的平均回报。

在价值股(即低估值股票),除了盈余净率,年化收益率均大幅高于市场平均回报。

如上图:

企业收益倍数  (EBITDA/TEV)效果最好,该指标产生了15.83%的最高年化收益率,比市场平均回报高出4.33%。 

***

企业价值倍数(EV/EBITDA)介绍:
它反映了投资资本的市场价值和未来一年企业收益间的比例关系。
公司价值EV=市值+总负债-总现金=市值+净负债

EBITDA=净利润+所得税+利息+折旧+摊销

EBITDA(Earningsbeforeinteresttaxdepreciationandamortization)(利息所得税折旧摊销盈余)=EBIT(Earnings before interest, tax )+折旧费用+摊销费用

EBIT=经营利润+投资收益+营业外收入-营业外支出+以前年度损益调整(或=净利润+所得税+利息)

部分内容选自公众号《量化云QuantCloud》

”如何通过量化手段,挖掘年均回报率20%的价值股'文章。

价值因子在A股长期有效
从2008年到2019年6月18日,A股各因子的累计表现。价值因子(Value),显示了很强的收益率,这个收益率主要来自做多低估值股票,做空高估值股票。我们看到价值因子的收益率非常稳定,从2008年至今获得了100%的收益,而且回撤很小。
从相对收益的角度看,这个收益率曲线体现了低估值股票在过去10年远远跑赢高估值股票,有很强的相对收益。

长期有效原因:
过去10年因子表现的研究中,看到价值因子不但是最有效的,而且回撤也较小,那么我们要思考,这个策略未来还会有效吗?我的答案是依然会有效,主要有两个原因。第一,A股市场仍然是散户主导,导致市场波动较大,容易发生错误定价;第二,宏观经济和产业政策的预期变化比较大

价值因子风险:
从2017年开始至今(2019-8月),价值因子并不是特别有效。事实上,2019年以来,没有任何一个因子跑出Alpha。今年是少数个股的独立行情,以核心资产为代表。

目前(2019年6月18日)价值因子状态:
无论是从中证800还是中证1000的成分股来看,PB估值明显是左偏的,PB小于1的股票数量已经很多,而PB高估的股票数量很少。这说明目前阶段大部分股票的估值都比较低。

**

约翰涅夫管理温莎基金 “买入低估值的股票'策略: 1964年开始,一直到1995年他64岁的时候退休。期间,温莎基金的年化回报率13.7%,年化超出基准3.5%(扣除费用后超出基准年化3.15%)

涅夫总回报比例(Total Return Ratio)公式:涅夫寻找那些TRR比例超过市场2倍的股票。比如标普500的TRR比例是0.7,他就会找1.4倍TRR的股票。

比如一个公司的盈利增速12%,分红率2%,市盈率10倍。这家公司的TRR就是12+2/10=1.4倍。

涅夫会寻找那些持续盈利增长,但并不是很快的公司。典型的公司盈利和收入五年增速在7%到25%之间,低于7%增速太慢了,高于25%往往要付出过高的估值。

部分内容来自公众号《点拾投资》'约翰·涅夫的投资启示:价值因子的长期有效性'文章

**

杠杆因子:

衡量企业的财务杠杆。基于不同的宏观、利率与公司自身的财务健康状况,投资者对于杠杆因子在不同的宏观背景下产生差异较大的预期。个人而言,杠杆因子并不是特别好的风险因子。

**

成长因子:

成长因子,简而言之就是买入市场截面上盈利增长率较高的股票,同时卖出盈利增长率较低的股票,在过往20年是唯一持续获得溢价的基本面因子。显而易见,高成长的上市公司相较于低成长的上市公司而言获得更高的风险溢价,是由于我国市场对于投资者而言就是个成长的市场,资本市场本身而言可以分享到经济高速发展的成果,并利用自己赚到形成再投资。但是与此同时,溢价的程度并不算太高(年化收益率1.24%)。

成长因子:  1/3 每股营收同比增速 + 1/3 每股收益同比增速 +1/3 一致预期净利润增速。
每股营收同比增速: 最近报告期比上一年度同类报告期营业收入;
每股收益同比增速:最近报告期比上一年度同类报告期eps;
一致预期净利润增速:wind 一致预期。

**

盈利因子:反映上市公司的盈利能力,通过上市公司的每股净利润构建所得。盈利因子在2015年之前表现平淡,但是在2015年股灾之后,盈利因子出现显著的反转,这是也是投资者在经历市场教训之后,对于企业盈利确定性的追求。反观海外市场,盈利和盈利质量一直都获得溢价,这种差异的产生主要是市场的主要参与群体所决定。

部分内容摘自公众号《 FunofHedgeFunds》透过因子看市场之一:国内市场投资行为变迁

**

质量因子:

(仅反映企业静态状态,关心较高的盈利水平)(未反映是否能持续地加速增长。加速的增长往往才是大牛股的关键。)

背后逻辑:一个饱受争议的因子,因为从传统的风险溢价视角看,财务质量较高的公司所面临的运营风险相对较小,投资者不应该从中获取更高的风险补偿。但难以置信的是,质量因子在不同时期,不同规模,不同国家均表现出了稳定的正收益。

原因猜测:这或许和垄断有关,财务质量较高的公司大多在行业内处于龙头地位,甚至占有垄断优势。垄断优势使得公司能在一定时期内维持高增长,进而推升股价。而当公司丧失垄断优势时,由于锚定效应的存在,财务质量会先于股票价格下滑,被剔除出高质量公司。因此,质量因子能长时间生效。

以上部分内容摘自:《太平基金》中因子投资:站在巨人的肩膀上。

质量因子拆分为三个维度:盈利能力、成长性和安全性。

基本面好的公司要比基本面差的公司更有优势,从盈利能力、成长能力和财务安全等角度,获取质量溢价。

盈利能力包括毛利率比总资产(gross profit over assets, GPOA)、ROE 、ROA 、现金流比总资产(cash flow over assets, CFOA)、毛利率(gross margin)和盈利中现金的占比(即盈利减去应计项目,ACC)这 6 个指标。

成长性则衡量盈利能力指标的变化率,但不考虑毛利率的变化,但不是直接计算各比率的变化,而是计算分子的五年变化,再除以滞后的分母项进行标准化。

安全性则包括 4 个指标,包括低 beta(BAB)、低杠杆率、低破产概率(O-score)和低 ROE 波动率。

对于每一维度,首先计算每一指标的横截面排序并用 z-score 方法标准化,然后计算各指标 z-score 之和,接着再次标准化,得到该维度的得分。最后,加总三个维度的得分并再次标准化,得到每支股票的质量得分。

**

巴菲特投资组合因子分析:

巴菲伯克希尔40多年间,年化超额收益高达17.6%.其中,市场因子平均回报6.8%,

质量因子平均回报3.4%,

低分险因子平均回报2.6%,

价值因子平均回报1.2%,

因子无法解释的3.6%。
巴菲特投资原则:以低价买入优质股票并长期持有。

对于市场组合,其暴露接近于 1 
对价值和质量因子有着显著的正暴露(分别达 0.40 和 0.47)
对 BAB(低风险因子)也有着一定正暴露
对规模和动量则有着小幅的负暴露,但并不显著。
对成长和股息收益率的因子暴露为负。

偏爱高配价值,质量因子,低BAB,低配规模和动量因子,有正的 alpha。

巴菲特廉价高质量低BAB公司的偏爱,而不是高增长的科技公司

**

模拟投资策略:

“股价低往往有两种原因,一种是公司本身一无是处,价值被市场充分认识,本该这个价格。另一种是公司本身质量很好,价值被市场严重低估,这才是价值投资所需要寻找的投资标的。

'剔除价值股里的垃圾股,  价值股中 甄别出高质量公司。”
不管是高综合质量的价值股还是伯克希尔,在投资10年期的基础上,95%的时间内,他们都跑赢了大盘。

第一步:使用估值指标《企业收益倍数(EBITDA/TEV)》选出低估值一组。

第二步:在低估值,价值股一组中利用五个指标,按照等权重组合起来,成为一个综合质量指标,选出高质量公司,便形成了高综合质量的价值股。


第三步:每年7月,换仓,回测

如图:最好的高质量价值股每年年化收益率高17.71% (毛利资产率)。

防止5种质量指标,万一某个出错了,利用五个指标,按照等权重组合起来,成为一个综合质量指标。

回测:高综合质量价值股的年化收益率为17%。与股神的扣除无风险收益之前的年化收益(20%)差距在3%-4%左右。


归因表现:价值投资和质量投资长期优异。

总结:选出物美价廉的并长期持有。

部分内容出自公众号《点拾投资》'质量因子,才是价值投资和高收益的核心“文章。

**

低PB市净率高f-score策略:

在低PB市净率价值公司股票中,选岀高f-score分值最高的股票。


F-Score由九大指标所组成,每个指标可得1分或0分:

ROA=资产回报率 ;大于0便得1分

ROA=今年的ROA-去年的ROA ;大于0便得1分

CFO=营运活动所得的现金流量; 大于0便得1分

ACCURAL=当期净利-营运现金流量; 大于0便得1分

LEVER=今年的负债比率-去年的负债比率; 大于0便得1分

LIQUID=今年的流动比率-去年的流动比率; 大于0便得1分

EQ_OFFER=增发股权 ;今年较去年有增发情况便得0分

MARGIN=今年毛利率-去年的毛利率; 大于0便得1分

TURN为=今年资产周转率-去年的资产周转率; 大于0便得1分

0-3分:基本面弱

4-6分:基本面适中

7-9分:基本面强

8-9分就是基本面很好的公司

***

质量因子指数

质量指数:

该指数主要依据ROE、分红盈利比等指标来筛选高质量个股,用来捕捉拥有低负债率和持续盈利的公司带来的超额收益。历史数据显示,它在弱宏观环境下有更好表现,属于防御大类指数。

***

具体质量指数:

中证东方红竞争力指数:在中证800指数成份股(也就是沪深300和中证500的集合)的基础上精选过去三年扣非ROE位于行业前20%的优质股,并剔除过去一年扣非净利润同比增长为负的公司,聚焦上市公司的盈利持续性。在优化权重上,根据市值分级靠档原则,一定程度上降低超大市值公司的权重,一定程度上分散风险。按以上方法,当单个行业样本个数为零时,将沪深300指数在该行业的全部样本股纳入指数。该指数以2009年12月31日为基日,以1000点为基点。中证东方红竞争力指数每半年调整一次样本股,样本股调整实施时间分别为每年5月和11月的第五个交易日。 

**

标普A股质量指数:先是用净资产收益率、资产负债应计率、财务杠杆三大质量因子选出打分最高的200只股票,再用市盈率、市净率、市销率等价值因子在其中的200只股票里选出100只。再由自由流通市值乘以质量因子打分加权,行业权重上限为40%,个股权重上限为5%与流通市值占比20倍中取低值,下限为0.05%。指数每半年调整一次,每年6和12月。

**

罗素1000.BetaPlus1000指数年化收益率为7.24%,年化波动率为27.63%,而它的风格因子指数中质量和价值指数表现最好约13%,而且年化波动率最低,即sharp率也高约0.6。如图:

质量和价值择时:

若质量和价值指数因子通过择时构成组合TAA,则收益率更高13.98%,但波动率更大,sharp率更小。

当 1 个月均线向上突破 6 个月均线时,标为上涨市;

当 1 个月均线向下跌破 6 个月均线时,标为下跌市。

均线系统存在滞后性,但总体来看符合预期。

在上涨行情中,价值指数的表现优于质量指数;而反观在下跌行情中,质量指数的表现无疑更加亮眼,展现出优秀的防御能力。

当 1 个月均线上穿 6 个月均线时,持有价值指数。当1 个月均线下穿 6 个月均线时,持有质量指数。


sharp率:收益指标/风险类指标。越大越好。个人认为也可简单理解为年化收益率/年化波动率。

***

低PE、高ROE指数基金汇总:

备注:文中至今的日期为2021年6月
1.消费红利指数(对应标的008929-泰达消费红利C、501089-方正富邦消费红利):
基期至今60倍涨幅,复合年化30.35%,最新ROE-18.03。着重消费,红利。

2. CS消费50(对应标的515650-富国中证消费50etf、009117-东兴中证消费50指数C):
这个指数基期至今33倍涨幅,复合年化23.74%,最新ROE-24.33,是消费股中更细挑了其中50只做为成分股

3. 医疗保健指数(对应标的159873-医疗设备etf、159891-医疗etf、516610-医疗服务etf):
这个指数基期至今34倍涨幅,复合年化23.9%,最新ROE-24.92,是医药类中医疗保健、器械、服务的细分综合指数

4. 消费龙头指数(对应标的501090-华宝消费龙头LOF、011854-招商消费龙头增强C)
第三个消费类指数。该指数基期至今27倍涨幅,复合年化22.32%,最新ROE-23.14,包括必选消费和可选消费的龙头

5.质量低波指数(对应标的006144-恒生前海中证质量成长C):
该指数基期至今21倍涨幅,复合年化21.18%,最新ROE-19.12

6.500质量指数,对应标的007593-鹏扬中证500质量成长指数A。该指数是质量+成长指数,基期至今23倍涨幅,复合年化21.07%,最新ROE-13.24,最新PE-14.97,历史百分位到了令人发指的0%

7.中美互联网指数(对应标的009226-天弘中证中美互联网C)
该指数基期至今4倍涨幅(基期是13年年底开始的),复合年化20.74%,最新ROE-20.42。目前PE-34.64

8.绩优策略指数(对应标的009195-泰达宏利中证绩优指数C):
该指数基期至今17倍涨幅,复合年化19.55%,最新ROE-26.53
9.300质量低波指数(对应标的011132-鹏杨沪深300)
以上部分内容摘自公众号《集思录》'10多年20倍以上的涨幅,低PE、高ROE指数基金大集合'文章。

***

质量增长因子:(反映是否能持续地加速增长。加速的增长往往才是大牛股的关键。)

背后的驱动因素更多是投资者的注意力缺失,而不对应系统性的风险承担。

***

纯因子:

纯因子组合对模型中某个因子具有单位暴露度,对其他因子暴露度为0,避免了传统的排序多空组合可能无意识暴露到其它因子上的问题。

了克服共线性,将描述股票同一类性质的多种因子合成大类因子,此处分别为成长、EP、BP、流动性、规模、非线性规模、beta、残差波动率、反转、动量、质量,合成。

纯因子回测:

选取的各风格纯因子组合均能超越基准组合,流动性、规模纯因子、反转因子组合超额收益明显高于其他因子。波动率方面,规模因子最大,成长因子最小。

在控制了风格因子之后,医药、有色、食品饮料和计算机贡献较高超额收益,而钢铁、交运、公用事业和轻工没有超额收益。从波动率可以看出,行业因子收益的轮动更加频繁和难以把握。

**

大类因子合成:

从子类因子合成为大类因子的方式是:先对各个子类因子值进行极值处理(±5% winsorization),再计算z-score,然后将各子类因子的z-score 按表中权重合成为大类因子值,并再一次对合成得到的大类因子值正态标准化,作为最终的因子暴露值。

以上部分内容摘自公众号《长江金工》利用纯因子组合检验因子有效性。

*********

因子周期:

成长、质量和动量在市场上涨、经济扩张和市场乐观时有较好的表现

质量、低波和红利在下跌市场、经济收缩和市场悲观时表现更胜一筹。

因子收益率存在周期性,但不同因子间的收益率存在较低的相关性。



**

各经济周期下不同因子表现如何:

经济周期:

**
时间分类(由长到短) 康德拉季耶夫周期 -库兹涅茨周期 -朱格拉周期 -基钦周期
朱格拉周期:9~10年的周期波动。一般从设备投资占GDP的比例看出。
“库兹涅茨”周期:也称建筑业周期,周期平均长度为20年。是一种长周期。
****

宏观环境分为了四类:经济增长(库兹涅茨周期进行刻画)和流动性(借助朱格拉周期辅助判断)

利用库兹涅茨周期对经济增长进行判定。

利用朱格拉周期、全市场估值水平、国债收益率等诸多信息确定流动性状态。市场的估值水平跟朱格拉周期基本是相反的状态。

2001年4月至2004年12月:经济增长&流动性紧张;

2005年1月至2006年3月:经济增长&流动性宽松;

2006年4月至2007年9月:经济增长&流动性紧张;

2007年10月至2009年6月:经济衰退&流动性宽松

2009年7月至2013年12月:经济衰退&流动性趋紧张;

2014年1月至2016年8月:经济衰退&流动性宽松:

2016年9月至2018年12月:经济增长&流动性紧张:

经济运行逻辑:

在理想环境下,我们认为在经济增长的时期,首先迎来的是流动性紧张,之后流动性将会短暂放松,后期流动性继续趋于紧张,接着经济将从增长转向衰退,同时流动性会迅速转向,进入经济衰退、流动性趋于宽松的阶段,在经济衰退的中期,流动性会短暂趋紧,之后再次趋向放松。最后经济从衰退转向增长,流动性随之转向趋紧,开启新的经济增长轮回。

**

经济周期与资产价格的逻辑:

当全社会的企业经营活动水平上升、企业盈利增加的时候,企业的信贷需求就会增加,资金从金融资产转向生产流通领域。导致了信贷价格(利率)开始上升,同时生产流通领域的价格也开始上升。利率的上升提高了金融资产的必要回报率,压低了金融资产的价格。同时生产流通领域的价格上升增加了整体价格系统的不稳定,对货币政策和整体的流动性水平形成制约。

当企业盈利开始下降的时候,对信贷的需求就会减少。资金开始从生产流通领域转向金融资产,信贷价格(利率)开始下降,利率的下滑压低了金融资产的必要回报率,资产价格的上升主要表现为估值的扩张。此时,过量的流动性将会大幅提高市场的风险偏好,压低风险溢价水平。

***

ROE与利率关系:

ROE与一年期国债利率画在一起,可以看到两者有很明显的同上同下的特征。在图中ROE数据似乎有落后于利率数据的现象,这是因为公司的ROE数据只有财报公布的时候才会更新,所以本身就是滞后的。但实际上,我们认为正是因为公司盈利水平的变化才使得利率发生了变化。

CRB综合商品指数反映了全球经济的总需求,因此其可以在一定程度上反映整体经济的趋势。

********

各经济周期下因子表现内在逻辑:

市值因子:小市值因子的表现体现了不同经济周期下投资者偏好的变化。当经济增长的确定性增强,资金将从不确定性更高的小市值股票中流出,选择盈利更为确定的大市值股票。而当经济逐渐走弱,拥有大市值特征的公司盈利变差的确定性也更强,资金将倾向于更有可能盈利的小市值股票,从而回避确定性变差的公司。也就是说,经济增长追求变好的确定性,经济走弱回避变差的确定性。

价值类因子:低估值的股票往往意味着投资者认为其“成长性”较弱,受经济的周期性波动影响较大,在经济变差的情况下,投资者大概率会回避受经济波动影响更大的股票,倾向于配置市场认可有高成长特征的高估值股票,从而使得估值因子表现一般。同时,在经济不太景气的宏观环境下,流动性往往相对充裕。在一个流动性充裕的阶段,投资者有更低的成本去追求“不确定的增长”,拉长投资组合的“久期”。因此价值类因子在这段时间表现都不佳。

成长类因子:与流动性也有比较密切的关系。

从历史来看,成长类因子主要在两段时期表现不佳,一次是2007年11月至2009年6月,第二次是2013年7月至2015年5月。这两段时间一次是经济增长的末期、一次是经济衰退的末期。两次都是开始于流动性紧张的末期

由于成长类因子指代的是已完成的“成长”,与多数投资者考察的未来的“成长”并不一致。在因子研究的框架下,成长是指过去已经实现的高成长,比如营业收入的增长、净利润的增长和ROE的增长。这种高增长往往具有一定的惯性,因此长期来看成长因子表现较好。同时,具有这种高成长特性的股票大部分是“蓝筹股”。

资金倾向于投资过往实现了高增长的确定性的股票,已经实现稳定的高增长的股票也往往具有防守特性。同时这两段时间市场的利率较高,投资者会更关注久期较短的资​产。资金的大量流入导致成长类因子的交易拥挤,成长类股票被高估,一旦流动性开始放松,投资者风险偏好提高,开始选择分散配置,不再单一盯紧成长因子,从而导致资金从成长类因子中流出,成长类股票估值回复。

质量类因子:具有中长周期特征

以ROE作为代表性的质量类因子,过往表现有两个特点,一个是受长周期经济走势的影响十分密切,二是在经济弱势的阶段,朱格拉周期的上行也会带动质量因子有不错的表现。从1998年至今,有三段时期ROE因子表现较好,第一次是2002年10月到2006年11月,第二次是2010年3月到2013年5月,第三次是2016年12月至今。第一次与第三次都发生在库兹涅茨周期明显上升的阶段,也就是实体经济开始了明显的增长,企业盈利增加,投资者的投资风格开始转向大盘价值,对基本面的重视导致ROE因子收益率快速累积。第二次是经济衰退过程中,库兹涅茨周期下行,朱格拉周期上行,出现了阶段性的流动性紧张,这个阶段高ROE的企业受到投资者的青睐,超额收益凸显。

beta因子、换手率因子与波动率因子:受经济周期的影响不大,来自股票自身的某些交易特性。波动率因子和换手率因子是这些因子中最接近理想alpha的因子,两个因子在历史上没有特别大的回撤,表现一直很稳定,同时这两个因子与其他因子的相关性都较低,适合长期在组合中进行配置。

杠杆类因子:本质上更接近风险因子而不是收益因子,当经济向好的时候高杠杆的股票表现要好于低杠杆的股票,当经济相对弱势的时候低杠杆的股票表现要好于高杠杆的股票。这说明,在经济强势期,投资者不排斥高杠杆的股票,较高杠杆的股票反而收益更高;当经济进入弱势期的时候,投资者相对偏好低杠杆的股票,这符合经济强势加杠杆、经济弱势去杠杆的经济学原理。

反转因子:与市值因子的相关性比较高,2001年之后到2006年底,实体经济表现强劲,市值因子与反转因子都是负向的收益,2007年之后一直到2016年下半年,经济走弱,市值因子与反转因子表现都较好。同时在流动性明显放松的08年至09年、14年至15年,两者超额收益明显。


****

各经济周期下因子表现:

当经济增长的时候,大市值、价值因子表现较好。

经济衰退的时候小市值、反转、杠杆类因子表现较好。

流动性趋于紧张的时候成长类因子一般都表现较好。

除去经济衰退叠加流动性宽松的时期,其余三种环境下质量类因子表现都可以。


换手率因子和波动率因子在不同的宏观环境下表现都比较好,这两个因子建议长期配置,没有放入投资时钟。

成长因子在因子投资时钟中的位置意味着当市场流动性趋于紧张的时候成长因子表现较好,但是并不意味着流动趋于宽松的情形成长因子都表现不好,我们的分析中发现成长因子是在经济长期趋势的尾声叠加流动性趋于宽松的情形中表现不好

价值类因子在经济长周期向上的环境中都表现较好,但是由于价值类因子内部差异较大,在经济长周期向下的环境中并不是都表现较差,例如BP因子在经济长周期向下的环境中表现一般的时间长度就要比EP因子和DP因子要短一些。

以上部分内容摘自《华泰金融工程》【华泰金工林晓明团队】周期视角下的因子投资时钟--华泰因子周期研究系列之二

**
A股历年各因子表现:

沪深300中质量,低波历年表现最好。

如图:A股质量因子,低波因子,价值因子历年年化收益表现最好。
内容摘自公众号《中证指数》

***
A股历年各因子表现:

****

度量因子的指标:

IC值意义:量化因子预测能力强与否,因子对股票收益预测性强度。

IC分析在整个单因子分析中起主导性作用。

IC的大小反应了因子暴露值与股票表现之间的线性关系,IC绝对值越大说明因子的预测性越高,选股的效果就越好。

因子对于股票收益的相对关系有预测性的作用,但具体反应到收益上还得根据收益率分析的相关指标来判断。

IC定义:information coefficient 的缩写,秩相关系数,衡量因子与未来收益的相关度,是指在某个时点上,给定股票池,股票池中所有股票的因子暴露值排名与其下期回报排名的截面相关系数。

IC 代表了预测值和实现值之间的相关性, 通常用以评价预测能力。


IC 的计算:一般有两种方法, normal IC 与 rank IC。 我们计算的是rank IC.normal IC: 因子载荷与因子收益之间的相关系数
rank IC: 因子载荷的排序值与收益的排序值之间的相关系数

IC值取值:取值在-1到1之间, 绝对值越大, 表示预测能力越好。
IC最大值为1,表示该因子选股100%准确,对应的排名分最高的股票,选出来的股票在下格调仓周期中涨幅最大;反之-1,则是反向指标。

实际中对于多年的IC均值,当I C绝对值 > 0.05 时,就可以视为有效因子,当I C 绝对值> 0.1 ,就可以认为是很好的阿尔法因子了。当IC均值接近0,可视为无效因子。

使用注意:由于IC 和 Rank IC 计算中存在的陷阱,要以以企业内在业务逻辑为先验,后再使用IC值。
部分内容观点选自公众号《川总写量化》“用 IC 评价因子效果靠谱吗?'文章。

***

因子IC的衰减分析:

Alpha 因子的效用并非在未来n个月均匀分布,而是呈现逐步衰减的形态,也就是说我们从月初获得的 alpha 要比n个月后获得的 alpha 高,持仓n个月不动的调仓方式在后半段资金利用效率较低,有必要在 alpha 衰退之前调仓。

****
IC_IR

获得稳定Alpha的能力:IR值
IR的是Information Ratio的缩写,即信息比率。衡量因子IC的稳定性。
IR指的是超额收益的均值与标准差之比。需要多个调仓期,每一个调仓期计算出一个IC值。

I R =( I C 的 多 周 期 均 值)/ (I C 的 标 准 方 差)
IR大于0.5时,因子稳定获取超额收益的能力较强。
IR等于多个调仓周期的IC均值除以这些IC的标准差,所以IR兼顾了因子的选股能力(由IC表征)和选股能力的稳定性(由IC的标准方差的倒数代表)

**

因子相关性:

考验因子间对收益率的增量贡献。因子间相关性越小越好。若因子间有相关性,则需进行正交化处理,通过A因子与B因子之间进行回归,得到A的残差,用残差代替因子A。

**

因子换手率
量化因子稳定性:因子的换手率越低越好。
因子的换手率是在不同的时间周期下, 观察因子个分位中个股的进出情况。

 计算方法举例: 某因子第一分位持有的股票数量为30支, 一天后有一只发生变动, 换手率为: 1/30 *100% = 3.33% 对于5日、10日的换手率,在每日都会对比当日1、5分位数的成分股与5日、10日前该分位数的成分股的变化进行计算。
换手率低的因子,因子值在时间序列层面的持续性更好。

***********因子模型

资产预期收益率分解:

资产预期收益率等于该资产因子收益率及该因子暴露程度。


***

因子收益率构建:

因子收益率:由满足“(投资组合仅在目标因子有大于零暴露,其他因子暴露为零),(该组合特质风险最小)” 这两条件的因子模拟投资组合下的收益率,则是该因子收益率。

因子收益率构建方法:采用排序法(适用个股指标数据与因子暴露相关联的风格因子),根据个股指标数据从大到小分十组,做多最大组,做空最小组,求的收益率。

第一步:将所有个股在该因子上的因子暴露在截面上标准化;

第二步:所有股票会按照因子的业务逻辑、根据因子暴露的数值从好到坏排列;

第三步:假设做多前 10% 或者 20% 的股票,做空后 10% 或者 20% 的股票,以此来构建一个零额投资的投资组合,它就是该因子的投资组合收益率就被称为这个因子的收益率。

前提:某因子构建的投资组合应该避免在其他因子上有任何暴露。

**

检查组合因子收益率是否有效方法:t值检验。

T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。

t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。

t值用公式t=(样本平均数x-总体平均数u)/(样本标准差s/根号(样本容量n))

P值能直接跟显著性水平比较;而t值想要跟显著性水平比较,就得换算成P值,或者将显著性水平换算成t值。在相同自由度下,查t表所得t统计量值越大,其尾端概率P越小,两者是此消彼长的关系,但不是直线型负相关。

查t表所得t统计量值越大,其尾端概率P越小。

*******

因子暴露值构建:
方法一:将因子收益率作为解释变量,资产收益率作为被解释变量,进行时序回归,回归系数作为beta
方法二:直接使用公司指标
构成一个Pandas的Series类型的数据,索引为股票列表,值为对应标的因子值。然后对这列数据排序,做标准化、中性化等数据处理后,买入前或者后x分位标的。

例如:因子暴露就是股票在因子所代表的特征上的取值,比如一个股票的 P/E 为 15.9,那么它对 P/E 因子的因子暴露就是 15.9。

***

因子异象:在多因子模型中存在一部分无法被多因子模型解释部分,而且'显著大于零',则该部分称为异象。无法解释收益率部分。

异象有效检验步骤:

多变量构建复合异象或因子:f-score g-score。

*******

多因子模型:

多因子模型核心:解释股票预期收益和因子预期收益之间关系。通过收益预测,风险控制,组合优化构建投资组合,以最优的权重利用各因子预测收益率。

多因子模型简写:

E[R_i] = β_i × λ

 E[ R_i ]   (E[.] 为数学求期望公式,R_i 代表股票 i 的超额收益) 

  β_i 为股票 i 的 K因子暴露    *  λ 因子收益率均值

模型意义:

横坐标为 β_i

纵坐标为 E[R_i]

斜率 λ :因子的预期收益

每个点代表一支股票

 α_i代表在每个样本内,E[R_i] 和 β_i × λ 之间的残差

多因子模型反映的是收益率均值和因子暴露在截面上的关系。

**

如何检验好模型:

如果我们能够在统计上证明所有股票的 α_i 都很接近零,那么这个多因子模型就是很好的模型 ,就是所有这些 α_i 联合起来是否在统计上足够接近零。即统计意义上无误差,或误差非常小。

只有有了准确的(无偏且相合)估计值和正确的标准误,才能评价因子是否有效。

**

标准误:《百度百科》标准误,即样本均数标准差,是描述均数抽样分布离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。标准误不是标准差,是多个样本平均数的标准差。

标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。

**

如何检验标准误?通过GMM方法检验。

**

检验模型好坏三步骤:

1. 挑选因子,计算个股在这些因子上的暴露 β_i

2. 找到个股(超额)收益率均值 E[R_i] 和因子暴露 β_i 在截面上的关系;

3. 计算每个个股的定价错误 α_i,联合检验这些 α_i 是否在统计上为零。

********时间序列/截面回归

用时间序列回归方法构建模型:

适用条件: 因子必须是 portfolio returns,才可只进行时间序列回归。

时间序列回归前提:因子收益率时序已知。

因子预期收益率:使用因子投资组合收益率。

第一步:使用排序法构建因子投资组合,计算因子收益率。

例如,Fama and French (1993) 提出了影响深远的三因子模型,它里面的三个因子,即市场、HML、SMB 都是投资组合的收益率。

HML 为例,它代表着 high book-to-market ratio 公司相对于 low book-to-market ratio 公司的超额收益。

第二步:通过时序回归求解因子暴露值。
通过回归,求出模型中参数,因子暴露 β_i;α_i(截距项)。

f_t 表示 t 期因子(不同投资组合的收益率)

使用 f_t 对每支个股 i 的收益率 R_it 做时间序列回归:

(每支个股 i 的收益率) R_it =

(截距) α_i+(个股 i 在因子上的暴露) β_i * (因子收益率) f_t  + ( 随机的残差 )ε_it

时序上做回归得到因子暴露截距

所有蓝黑色点(个股)到这条红线的距离就是个股的定价错误 α_i,这条时序回归得到的直线并不是以最小化 α_i 的平方和为目的求出的,这是时序回归和下一节要介绍的截面回归的最大差别(截面回归是以最小化 α_i 的平方和为目标的)。


第三步:计算标准误,所有股票的错误定价 α_i 联合起来是否在统计上为零。检验模型好坏。

***
用截面回归方法构建模型:

截面回归:适用更广泛,即适用风格因子,也适用宏观GDP CPI及利率宏观因子。因子收益率可以未知。因子可以不是 portfolio returns。比如因子可以是 GDP、CPI、利率这些宏观经济指标。


第一步:利用N个时序回归得到每个因子暴露值,得到因子暴露值均值。

通过时间序列回归得到个股在不同因子上的暴露。

原因:有些因子取值(比如 GDP 的取值、CPI 的取值)不能直接当作暴露值。
因为时序上我们关注的是这些因子的变化对个股收益率变化的解释程度(model of variance),这由个股收益率对这些因子的敏感程度,即时序回归的系数 β_i,而非因子本身的大小决定。第二,行业不同、基本面存在差异的公司受宏观经济的影响也不同,因此它们在同样宏观经济指标上的暴露势必不同。

时序回归得到暴露值β_i。

第二步:截面回归,使用上一步的因子暴露均值,k个资产收益率平均值,只做一次截面回归,使用OLS回归求解模型得到因子预期收益率,以及每个资产定价误差

截面回归,从而确定每个因子的预期收益率λ。

个股的预期收益率(在整个 T 期的收益率均值)E[R_i]

= β_i * (因子预期收益率) λ + (代表股票定价错误的残差 ) α_i

在截面回归时采用 OLS,截面回归 OLS 将通过原点并最小化所有个股残差 α_i 的平方和。


第三步:计算因子预期收益率标准误和资产定价误差标准误,构建t_统计量进行检验。使用GMM检验误差 α_i 是否为零。检查模型是否可靠。

截面回归利用了所有个股的数据。从某种意义上来说,这更合理。对于时序回归,因子的平均收益率就是该因子组合在 T 期收益率上的均值:λ = E_T[f]。而对于截面回归来说,因子收益率通过 OLS 或 GLS 确定,取值和 E_T[f] 不同。这是二者最大的区别。
部分内容摘自公众号《量化投资与机器学习》文章”如果你研究多因子模型,这篇文章看不懂就别玩了!'。

**
fama-macbech截面回归:
第一步:利用N个时序回归得到每个因子暴露值
第二步:每个时间点,以t期收益率,t期每个资产暴露值,求OLS回归,得到每期每个因子收益率,及每期每个资产定价误差。
第三步:求解每期每个因子收益率,及每期每个资产定价误差的标准误,构建t_统计量进行检验。
**
截面回归多因子模型:
第一步:使用公司特征作为个股因子暴露
第二步:利用个股因子暴露值和资产收益率,通过截面回归计算因子收益率。(更大的纯因子暴露)
优点:更能解释资产收益率预期差异,即资产定价误差更接近零。

*****
主流因子模型汇总:

Fama-French 三因子模型:

Fama and French (1993) 在 CAPM 的  市场因子(MKT) 基础上加入了价值(High-Minus-Low,即 HML)和规模(Small-Minus-Big,即 SMB)两因子,提出了 Fama-French 三因子模型,它也是多因子模型的开山鼻祖。

 E[R_i] 表示股票 i 的预期收益率-  R_f 为无风险收益率  =
β_MKT因子暴露*(E[R_M] 为市场组合预期收益率-R_f ) 
+ β_SMB因子暴露* E[R_SMB]  规模因子预期收益率 
+  β_HML因子暴露*E[R_HML]  价值因子预期收益率

价值因子:使用 book-to-market ratio(BM )。
规模因子:使用市值。

市场因子预期收益率:做多全市场市值加权指数同时做空无风险利率的组合。


市值因子预期收益率:
以纽约证券交易所(NYSE)中上市公司的市值中位数为界,把 NYSE、纳斯达克(NASDAQ)以及美国证券交易所(AMEX)的上市公司分成小市值(Small)和大市值(Big)两组。

价值因子预期收益率:
以 NYSE 中上市公司 BM 的 30% 和 70% 分位数为界,把这三大交易所的上市公司分成三组:BM 高于 70% 分位数的为 High 组、BM 低于 30% 分位数的为 Low 组、位于中间的为 Middle 组。

S/H、S/M、S/L、B/H、B/M 以及 B/L。将每组中的股票收益率按市值加权得到 6 个投资组合;利用它们,Fama and French (1993) 使用如下方法构造' 市值HML” 和 ' 价值SMB '因子:如图:

在每年六月末,使用上一财年最新的财务数据对股票重新排序并对这两个因子进行再平衡。

优点:有足够的开创性
缺点:“适用性”却有限,有很多其无法解释的异象。在众多异象中,最显著的当属截面动量异象。

**

2.Carhart 四因子模型:
在 Fama-French 三因子模型中加入了截面动量因子(取动量英文单词前三个字母、记为 MOM)并提出了 Carhart 四因子模型:

 E[R_i] 表示股票 i 的预期收益率-  R_f 为无风险收益率  =
β_MKT因子暴露*(E[R_M] 为市场组合预期收益率-R_f ) 
+ β_SMB因子暴露* E[R_SMB]  规模因子预期收益率 
+  β_HML因子暴露*E[R_HML]  价值因子预期收益率
+β_MOM 动量因子暴露* E[R_MOM] 动量因子预期收益率

动量因子预期收益率:在实际使用中,Carhart (1997) 使用 NYSE、NASDAQ 以及 AMEX 的全部股票,每月末将它们按 t - 12 到 t - 1 这 11 个月的总收益率排序,并通过做多排名前 30% 同时做空排名后 30% 的股票构建动量因子。Carhart 并未使用动量和市值进行双重排序,且在计算动量因子收益率时,多空两头内的股票均采用等权配置。

***

3.Novy-Marx 四因子模型:增加了盈利因子

 E[R_i] 表示股票 i 的预期收益率-  R_f 为无风险收益率  =
β_MKT因子暴露*(E[R_M] 为市场组合预期收益率-R_f ) 
+ β_PMU 盈利因子暴露*E[R_PMU] 盈利因子预期收益率
+  β_HML因子暴露*E[R_HML]  价值因子预期收益率
+β_UMD 动量因子暴露* E[R_UMD] 动量因子预期收益率

盈利因子使用毛利润

盈利因子预期收益率,使用相应的指标与市值进行双重排序法。
以 NYSE 中上市公司的毛利润 GP 的 30% 和 70% 分位数为界,把 NYSE、NASDAQ 以及 AMEX 三大所上市公司依据毛利润 GP 高低分为盈利(Profitability,即毛利润 GP 在 70% 分位数之上)、中性(Neutral,即毛利润 GP 介于 30% 和 70% 分位数之间)以及不盈利(Unprofitability,即 GP 在 30% 分位数之下)三组。这三组和市值高低一起划分共得到 6 个投资组合:S/P、S/N、S/U、B/P、B/N 以及 B/U。每个组合中的股票均按其市值确定权重。

动量因子的投资组合每月进行再平衡,而价值和盈利因子每年六月末使用最新的财务数据重新构建投资组合。

**

4.Fama-French 五因子模型
Eugene Fama 和老搭档 Ken French 在他们的三因子模型基础上添加了盈利和投资两个因子,提出了新的五因子模型

 E[R_i] 表示股票 i 的预期收益率-  R_f 为无风险收益率  =
β_MKT因子暴露*(E[R_M] 为市场组合预期收益率-R_f ) 
+ β_SMB因子暴露* (E[R_SMB]  规模因子预期收益率  ) 
+  β_HML因子暴露*(E[R_HML]  价值因子预期收益率)
+ β_RMW盈利因子 暴露*E[R_RMW] 盈利因子预期收益率
+ β_CMA投资因子暴露 *E[R_CMA] 投资因子预期收益率
每年六月末,使用最新财务数据对股票重新排序并对规模、价值、盈利和投资这四个因子投资组合进行再平衡。

盈利因子预期收益率 使用 ROE 和市值进行 2 × 3 双重排序,分别得到六个投资组合。

投资因子预期收益率 使用 过去一年总资产变化率和市值进行 2 × 3 双重排序,分别得到六个投资组合。
投资因子,以 NYSE 中上市公司总资产变化率的 30% 和 70% 分位数为界,把三大所上市公司依据总资产变化率高低分为 激进(Aggressive,即总资产变化率在 70% 分位数之上)、中性(Neutral,即总资产变化率介于 30% 和 70% 分位数之间)以及保守(Conservative,即总资产变化率在 30% 分位数之下)三组。用这三组和市值高低进行双重排序就得到 6 个投资组合:S/A、S/N、S/C、B/A、B/N 以及 B/C。由于预期投资和预期收益率负相关,因此使用保守组 S/C 和 B/C 和激进组 S/A 和 B/A 的收益率之差构建投资因子

**

5.Hou-Xue-Zhang 四因子模型又名q-factor model
风险收益率  =
β_MKT因子暴露*(E[R_M] 为市场组合预期收益率-R_f ) 
+ β_ME因子暴露*  E[R_ME]  规模因子预期收益率  
+ β_ROE 盈利因子暴露* E[R_ROE]盈利因子预期收益率
+ β_I/A 投资因子暴露 *E[R_I/A]  投资因子预期收益率

 使用 ROE 和总资产变化率作为代表盈利和投资的指标。在构建因子时,为了体现上述条件预期收益率的关系,他们使用市值、单季度 ROE 和总资产变化率进行 2 × 3 × 3 独立三重排序,其中市值按纽交所中位数划分、ROE 和总资产变化率按纽交所 30% 和 70% 分位数进行划分。

***

6.Stambaugh-Yuan 四因子模型:
在市场和规模因子的基础上,引入管理因子和表现因子,构建了四因子模型

 E[R_i] 表示股票 i 的预期收益率-  R_f 为无风险收益率  =
β_MKT因子暴露*(E[R_M] 为市场组合预期收益率-R_f ) 
+ β_SMB因子暴露* (E[R_SMB]  规模因子预期收益率  ) 

+ β_MGMT管理因子暴露* E[R_MGMT]管理因子预期收益率
+ β_PERF表现因子暴露 *E[R_PERF] 表现因子预期收益率

四因子模型中,管理因子和表现因子均源自关于错误定价的研究。错误定价意味着价格较内在价值的偏离,当价格高于内在价值时资产被高估,当价格低于内在价值时资产被低估。被高估的资产在未来由于价格的修正会出现较低的收益率,反之被低估的资产在未来则会获得更高的收益率。为了从错误定价中寻找因子的灵感,首先要找到衡量股票价格是否被高估或低估的指标。

以 11 个 Fama-French 三因子模型无法解释的异象为基础,构建了错误定价指标。这么做背后的逻辑是,异象的超额收益反映了其投资组合内股票的收益中无法被 Fama-French 三因子模型解释的超额收益,即个股的错误定价。因此,异象变量取值的高低就可以用来描述错误定价的方向(被高估或是低估)和大小。

将这 11 个异象根据它们之间的相关性分成两组,使得每组内的异象之间相关性更高,而分属两组的异象相关性较低。
第一组包含股票净发行量、复合股权发行量、应计利润、净营业资产、总资产增长率以及投资与总资产之比 6 个异象。这 6 个异象变量均和上市公司的管理决策相关,使用它们构建的因子被称为管理因子。

第二组包含另外 5 个异象,即财务困境、O-分数、动量、毛利率以及总资产回报率。它们均和上市公司的表现有关,使用它们构建的因子被称为表现因子

在每月末,对于这两组中的每一个异象,使用异象变量在截面上对股票排序。排序时,从每个异象指标和未来预期收益率的相关性方向(即正、负相关)出发,将被高估的股票排在前面、被低估的股票排在后面。如果异象变量和收益率呈负相关(比如应计利润),则按变量取值从大到小排序,取值最高的排第一、第二高的排第二、以此类推、取值最小的排最后。反之,如果异象变量和收益率呈正相关(比如动量),则按变量取值从小到大排序,取值最低的排第一、第二低的排第二、以此类推、取值最高的排最后。

使用全部异象变量对股票排序后,每支股票就有 11 个分数。把管理和表现两组内的 6 个和 5 个异象排名取平均,就得到每支股票在两组内各自的综合排名。综合排名越高,说明该股票价格越被高估,其未来预期收益越低;综合排名越低,说明该股票价格越被低估,其未来预期收益越高。

有了股票在管理和表现这两个变量上的排名,接下来使用市值和这两个变量依次进行 2 × 3 双重排序,构建管理、表现以及市值三个因子。

在使用市值排序时,该模型和其他多因子模型一致,使用 NYSE 包含股票的市值中位数将所有股票分为大、小市值两组。然而,对于管理和表现这两个变量则是将三大交易所的股票混合在一起,使用所有股票在这两个变量上各自的 20% 和 80% 分位数划分成高、中、低三组。这种做法和其他多因子模型的处理有两点不同:(1)划分的断点没有使用 NYSE 股票的分位数,而是全部股票的分位数;(2)划分阈值没采取传统的 30% 和 70% 分位数而是另辟蹊径采用了 20% 和 80% 的分位数

大量实证结果显示,错误定价在小市值股票中更为突出。这些特点使得传统的构造方法无法在规模因子的多、空两头对称地消除错误定价的影响,造成规模因子有被高估的偏误,因此不宜采用。正因如此,Stambaugh and Yuan (2017) 才采用了不同的方法构造规模因子。他们的实证表明,如此构造的规模因子比传统方法得到的规模因子有更高的风险溢价

**

7.Daniel-Hirshleifer-Sun 三因子模型:

把行为金融学应用于资产定价尝试。该文从长、短两个时间尺度上提出两个行为因子(behavioral factors),与市场因子一起构成了一个复合三因子模型:

 E[R_i] 表示股票 i 的预期收益率-  R_f 为无风险收益率  =
β_MKT因子暴露*(E[R_M] 为市场组合预期收益率-R_f ) 
+β_FIN 长周期因子暴露* E[R_FIN] 长周期因子预期收益
+β_PEAD 短周期因子暴露*E[R_PEAD]短周期行为因子预期收益

背后逻辑:旨在捕捉由于过度自信(overconfidence)和有限注意力(limited attention)造成的错误定价,从而解释学术界之前发现的大量选股异象。从行为金融学的角度出发,股票收益率之间的共同运动通常有两个原因:(1)股票错误定价上的共性;(2)投资者对于股票基本面新息的错误反应上的共性。

短尺度异象的PEAD 因子: 短时间尺度的异象大多来自投资者的有限注意力, 不同的股票实际上暴露在一些共同的风格风险上,而情绪冲击会造成同一类风格的股票收益率的共同运动,因此同一类风格上的股票存在相关性很高的错误定价。

长尺度异象的 FIN因子 :长时间尺度的异象大多来自投资者的过度自信,由于认知偏差,投资者难以对股票基本面方面的新息做出及时、正确的反应,因此也会导致错误定价。

以上7个模型均是时序多因子模型

以上部分内容选自公众号《川总写量化》主流多因子模型巡礼

***

7.Barra模型

介绍:

Barra模型为Barr Rosenberg和Vinay Marathe两位学者提出。它的主要作用在于能将市场许多的信息进行综合得出对于证券收益会产生影响的公共因子,然后运用这些公共因子进行投资相关的归因分析和风险预测.

BARRA模型是一种常用的多因子风险管理模型。我们可以把任何股票的收益率归因到几个不同的风险因子上,所采用的因子类型通常分为风格因子和行业因子两大类。

风格因子涵盖成长类、估值类、盈利类、规模、非线性规模类、流动类、财务杠杆类、Beta、波动率和动量十大类因子。

行业因子,按照WIND或者中信行业分类,每个行业对应一个行业因子,用于定量描述,行业属性为整体收益带来的影响。

**

模型构建:


Barra主要有归因分析模型和风险预测模型。

第一步:因子暴露

利用时间序列回归求解,通过个股收益率序列对因子收益回归,估计因子暴露。

在时间序列回归的估计窗口内,因子暴露是固定的,而因子收益率是变化的。因此,这样估计得到的因子暴露对于市场的变化反应较慢。时间序列回归方法在学术论文中比较常见,学术界的做法偏向于“解释”收益率。

时间序列回归:首先需要确定因子收益率。即用股票超额收益率和风险因子超额收益率进行回归,计算公式为:


直接使用股票指标求解因子暴露:

比如针对贵州茅台,由于它属于食品饮料行业,因此贵州茅台股票对“食品饮料”行业的行业因子暴露度为1,对其他行业的行业因子暴露度为0。进一步,如果市净率是一个我们关注的因子,如果我们知道贵州茅台某时点的市净率为p,以及该时间点全市场股票的市净率的平均值u和标准差sigma,那么我们就可以使用类似ZScore标准化数据的方式计算得到贵州茅台对于“市净率风格”的因子暴露度X:


第二步:求因子收益率

利用横截面回归,在每一期通过个股收益率对因子暴露回归,估计因子收益率。在横截面回归中,因子暴露会根据公司特征的变化及时变化,每一期的因子暴露和因子收益率都是变化的,从而能够及时的反映市场变化情况。

横截面回归:首先需要确定因子期初暴露,定义出 ,然后利用一系列横截面数据回归得出公共因子的收益率,进而求出这些公共因子的协方差矩阵,最终运用这些公共因子的协方差矩阵并利用相关的计算公式对投资组合的收益和风险状况进行分析。

第三步:构建模型

**
Barra模型三种分类:短期模型、长期模型日频模型,分别适用于日度、周度、月度、季度等不同的调仓频率。
Barra给中国股票市场编写了三个版本因子CNE5  ( A股) ,CHE2 (A股和B股)   ,CHE1(A股,B股和H股)

以上部分内容'【云通量化多因子】Barra这么热,你想要的细节都在这里”文章

***************
如何多类资产因子配置:

目地:识别出“因子具有最优暴露'的资产,通过预测因子的分布和相关性,来进行资产配置。

事例:
桥水基金推出了“全天候”策略,策略本质基于宏观因子的资产配置框架。
根据资产对'经济增长'和'通货膨胀'的因子暴露来分配资产,实现成功的资产配置策略。

债务驱动投资(LDI)策略,本质上,LDI方法将资产分为两个部分:“对冲因子'和'成长因子'投资组合。

对冲投资组合通常由长久期债券(long-du一ration bonds)组成,旨在模仿养老金的债务,目的是减少融资比率的波动性。建立对冲投资组合时,久期和收益率曲线敞口等指标至关重要。

成长因子投资组合可能包含股票、高收益资产、房地产或其他成长资产,目的是缩小融资比率缺口。在构建成长投资组合时,股票beta和收益率差(yield spread)等指标较为重要。

配置因子类别:
1.风格因子,依赖于一些股票异象提出的横截面资产定价风格因子。不同资产类别的因子组合可以组合成一个多元资产投资组合。

2.宏观因子,用能够反映实际经济状况(如经济增长和通胀)的变量,构建对这类宏观因子具有理想暴露水平的投资组合。通过最优化方法获得与预期目标偏差最小的投资组合。宏观因子的暴露通过时间序列回归(有时加上自由判断)来估计,以确保资产对预先确定的因子集具有直观的暴露。

3.异质因子

因子配置方法:
由于'宏观因子'和'风格因子'都可以解释资产收益率,将二者结合在同一个资产定价模型中,检验二者是否可以互补。

资产选择:
1. 股票:   a.美国大盘股(R1000)   b.美国小盘股(R2000)   c.美国房地产投资信托基金(REIT)   d.新兴市场(EM)
2. 固定收益:   a.雷曼总债券指数(AGG)   b.美国高收益债券(HYLD)   c.通胀挂钩债券(TIPS)
3.大宗商品:   a.黄金   b. 道琼斯大宗商品指数(DJAIG)4. 现金:   a.现金(RF)

**

跨资产Alpha模型框架分为以下步骤:


1. 选择宏观经济和风格因子,选择一组稳健的因子,宏观变量、风格因子和异质因子。
如图:


宏观因子选择:
经济增长(GRWTH)、通货膨胀(INFLTN)和实际利率(REAL)三因子

2. 估算因子的暴露程度
该投资组合对多种资产分配权重,以捕获承担相应因子风险的收益溢价。为了构建因子模拟投资组合,估算每种资产类别的'因子暴露',以便我们将'因子暴露'映射为资产权重。即因子暴露值高的,则该资产多配置。

宏观因子暴露方法:
由于资产在短期内受到因子的影响相对稳定;通过时间序列回归来对暴露进行估计。
更长的时间周期,由于一些因子关系的变化,用总收益对宏观因子代理变量进行回归

使用滚动3年的数据进行时间序列回归来估计资产对这三个宏观因子的暴露。

风格因子暴露方法:
每种资产的原始暴露值做了标准化处理(取Z-score)

'基于资产收益'的风格因子,直接比较不同资产类别的因子暴露,例如动量和波动因子。

“特定资产类别的基本面变量”的风格因子,如价值和利差(carry),我们计算了因子暴露时间序列的百分位数或Z-scores,使它们在各个资产类别中具有可比性。

风格因子,将滚动1年的累计收益作为动量,并将滚动1年的资产收益率标准差作为波动率。

3.构建因子模拟投资组合
构建出战术策略和战略策略。战术配置(TAA)与战略配置(SAA)的差异起始于因子暴露的估算阶段。

对于战术配置(TAA)因子模拟投资组合,我们使用同期风险暴露来得到短期因子暴露相对于均衡状态的偏差。

对于战略配置(SAA)因子模拟投资组合,我们使用短期因子暴露的扩展窗口平均值来得到资产与因子之间的持久关系。

采用了因子模型方法来构建因子模拟组合。
采用了Jones、Lim和Zangari(2007)的投资组合方法,可以看作是扩展的Fama–MacBeth回归。

假设用以下因子模型来表示资产收益:



R=FB+&
R是模型范围中资产的收益向量,B是模型范围中宏观因子的暴露矩阵,F是所有宏观因子的模拟投资组合的收益向量。

通过在每个时期重复构建因子模拟投资组合,我们创建了投资组合收益的时间序列

结果:从战术和战略角度来看,所有因子都具有正的超额收益。这表明承担了系统性风险(尤其是宏观因子的风险),就会获得对应的正溢价。风格因子也具有正的回报溢价。
战略因子相比,我们发现战术因子的表现具有更大的波动性。

4. 预测因子组合收益
生成的模拟因子组合的收益序列,我们可以更好地理解因子模拟组合的收益特性并做出预测


举例:
投资目标是最大程度地权衡风险-收益。为此,我们需要预测因子模拟投资组合的收益。通过在每个时间段重复因子模拟投资组合计算过程,并将投资组合权重乘以资产收益,可以为这些因子模拟投资组合生成收益序列。收益数据可以帮助我们理解因子模拟投资组合回报的分布特性并做出预测。

即使用历史平均值作为预测值。为了区分长期预测和短期预测,我们使用滚动1年的因子模拟投资组合收益作为短期预测,使用扩展窗口均值作为长期预测。

5. 创建最优因子组合

通过对因子模拟投资组合进行加权,可以得到最优因子投资组合。

构建组合的目标可以分为以下三类:风险最小化、目标因子暴露、最大化风险调整后收益。


本文采用了“最大化风险调整后收益'。
长期来看,因子收益为正,然而我们仍然希望能够通过配置获得短期的收益。因此,我们在战术最优因子组合中并未对因子权重进行限制,对于战略最优因子组合来说,会对权重进行限制,限制权重大于0。在两种情况中,权重之和必须等于1

6. 推断资产预期收益


7. 建立最终的最优投资组合

三种策略均产生了可观的风险调整后收益,夏普率均在0.82到0.94之间。根据下表,策略的年化换手率极低,为23%。此外,战术策略仍然产生了可观的信息比率,范围在0.52到0.75之间。


以上,内容摘自公众号《fofpower》资产配置vs因子配置—我们能否构建一类两者兼顾的策略

*******
如何将因子暴露映射到资产配置

宏观因子使用:
6个宏观经济因子是股权、实际利率、信用、通货膨胀、新兴市场和商品

举例

目标因子暴露:
我们选择一组特定的目标暴露:如图

目标函数:

由于因子基准中有15种可投资资产,而只有六个因子

确定最优资产权重的目标函数定义如下:

使用平方因子暴露偏差与主动风险项的和最小,

其中平方因子暴露偏差指的是相对于因子基准的因子暴露偏差的平方,

主动风险项是惩罚系数λ乘以投资组合相对于因子基准的主动风险。

约束条件:完全投资与纯多头限制,最小交易量我们将资产的最小交易量设置为2.5%,资产类别约束,流动性,主动风险,换手率。

目标函数最优化过程:

以上部分内容来自公众号《 fofpower  》【量化因子】海外文献推荐:如何将因子暴露映射到资产配置

*************

因子轮动:

风格因子选择:
根据有效性,依据因子IC测试筛选长期表现较好的因子,认可度,低相关性,选择了估值、反转、情绪等八类常见量化因子来构建大类风格因子。如图:

因子的构建:因子标准化,因子方向变化,市值行业中性化。

大类因子表现测试:
从IC测试和五分位组合测试两个维度对大类因子表现进行总结。



相关性分析:无论是否经过中性化处理,大类因子之间的两两相关性都处于较低的水平。总体来看,仅有风险因子与估值、反转和流动性因子的相关性较高。

因子权重动态配置:
举例:基于收益信息即(IC加权)动态配置因子:

基于风险信息(反向波动率加权)(风险平价配置)  (最大分散化配置 )  (全局最小方差配置) (最小CVaR配置)  的动态配置因子

基于收益与风险信息 ( 历史ICIR加权配置)  (最大化IR配置方法)   ( 均值方差配置)的动态配置因子

效果评估:

举例:以'基于全A选股池'为样本


收益:
基于中性化(IC加权)25.29%和(ICIR加权)26.13%在收益端增加最为明显,一般来看能够具备超过基准的收益;在风险调整后的表现方面,最大化IR、最大分散化方法具有更好的表现;

波动率:
IC加权与ICIR加权方式权重的波动率较大

基于风险信息的配置方法权重波动率普遍较小

均值方差方法前后两期权重相关系数较低,其他方法都在90%以上。

尾部风险维度:
因子动态配置方法大体都能有效的降低投资组合尾部风险;其中最大分散化、最小方差、最小CVaR三类方法效果改进效果最为显著。

举例:以'基于沪深300股池'为样本
收益:
沪深300选股池中,IC加权和ICIR加权不存在对收益的增加效果(10.35%),(10.20%)

波动率:
与全A中测试结果基本一致:IC加权与ICIR加权方式权重的波动率较大,而基于风险信息的配置方法权重波动率普遍较小(其中风险平价配置方法与基准极为接近);均值方差方法前后两期权重相关系数较低,其他方法都在90%以上。

以上内容摘自公众号《fofpower》【量化因子】海外文献推荐:因子轮动研究系列之三: 因子动态配置手册
*********

参考书籍,如图:,这不是广告,仅为感兴趣者,发下书籍照片。

文章仅做交流,学习。不做为投资建议。

欢迎后台留言交流,作者:世界的清晨清新ZZQ

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多