分享

况客私募基金投资解决方案系列之三:Regime-based私募产品标签分类体系构建

 昵称40862208 2019-10-17

摘要:本篇报告构建了自上而下的私募产品标签分类的逻辑体系。以周期划分为基础,对因子库进行了因子筛选、聚类复合,并用复合因子作为工具对私募产品进行标签分类。

  • 周期划分:我们选择了两套框架—基本面与流动性框架、股权风险溢价框架,以求从不同角度捕捉私募产品的风险暴露情况;

  • 因子筛选:根据因子在各个框架上的上、下行表现对因子进行打分,过滤掉对周期框架适应性低的因子;

  • 聚类复合:为了使因子满足数量适当,覆盖面广,能用于“泛化”等要求,我们使用K-means对上一步筛选出的因子进行聚类,并对聚类出的因子进行等权重复合;

  • 私募产品标签分类:使用复合因子对产品贴标签,并根据暴露最多的因子标签对产品进行分类。

整套基于Regime的私募产品标签分类体系中的每一步都能体现出框架构建对后续步骤的影响。对于基本面与流动性框架,产品标签分类的结果侧重于反映基本面因子的适应性,而股权风险溢价框架下的结果则更多地受到量价因子的影响。因子聚类结果和框架的经济学含义有逻辑的内在一致性。

从Regime构建开始到标签分类环环相扣的推导逻辑,为后续自上而下地评价、预测、配置私募产品提供了依据。

况客Regime-based资产风险收益预测模型是在美林时钟资产配置模型的基础上进行了延伸和扩展,用于大类资产的战略资产配置。在研究私募产品分类时,我们希望延续“regime-based”的思路,从构造适用于私募产品的周期划分框架开始,根据新构建的regime框架过滤因子,选择适用于该regime框架的因子对私募产品进行标签及分类,从而建立自上而下的、系统的私募产品标签分类逻辑。

1   建立适用于私募产品的周期划分框架

在战略型大类资产配置模型中,用于Regime划分的经济指标需要尽量反映整个宏观经济状况,而在评价大类资产的其中之一—权益类市场的产品时,继续使用这些指标和框架显得有点“不合身”,因此需要重新选择指标,为私募产品量身定制regime划分框架。

(1)Regime划分指标选择

在划分周期时,按照美林时钟的方式,通常习惯于选择2至3个指标作为划分标准,以指标的上、下行情况,或数值所属高、中、低的范围对时间轴进行周期划分。为了使划分出的周期既简单明了,且具备一定的经济学含义,又能尽量多地捕捉、总结信息,我们选择了两种划分经济场景的方式,每种包含两个指标,通过考察其上、下行情况进行周期划分,最终得到两个周期划分框架,每个框架包含4个regime(2个指标*2个状态)。

第一种我们使用月频指标组合:工业企业利润累计同比-M2同比,A股月度换手率。

工业企业利润作为一个经济基本面指标反映了经济增长情况,同时也代表了A股大部分企业的盈利状况,而M2增速则反映了市场流动性的匹配情况。两个指标的差值,我们希望可以指示目前市场是基本面驱动还是流动性驱动的倾向。经济基本面与货币流动性的强弱对比会影响权益市场内不同板块的走势,进而体现在一些基本面类因子和流动性敏感类因子的表现上。而换手率则代表了我们研究的是股票二级市场,整体的交易情况将会囊括众多市场信息。

因此我们也将第一种Regime框架命名为:基本面与流动性框架。

第二种我们使用日频指标组合:股权风险溢价(Equity Risk Premium,以下简称ERP),A股日换手率。

股权风险溢价(ERP)是投资者承担股市风险的补偿,也是一种衡量市场风险偏好的手段,我们根据股票定价模型推导,按照风险溢价=市盈率倒数+GDP增长率-国债收益率,来进行隐含风险溢价的计算。其中市盈率倒数使用滚动市盈率(除金融石油石化)的倒数,国债收益率取3个月国债到期收益率。不同于上一个框架侧重于反映经济状况的变化,ERP侧重于识别影响权益市场的投资者情绪和偏好程度。考虑到股权风险溢价作为一种风险补偿是决定股票价格的重要因素,而大多量价类因子都是围绕价格走势来构建的,所以风险溢价逻辑上应该有更好的识别量价类因子表现的能力。此外换手率的引入原因同上。

因此我们也将第二种Regime框架命名为:风险溢价框架。

(2)Regime划分方法

在划分Regime时,我们尽量控制regime以适当频率出现,因为若每个周期持续的时间过长,一个regime在历史中可能只出现过一到两次,此时可能会出现历史参考太少而难以判断因子或产品在相应周期上的历史表现。

对于基本面与流动性框架的月频指标组合,为保持周期尽量为月度切换,我们直接根据其月度涨跌幅的符号方向进行指标上、下行划分,指标值上涨为上行,下跌为下行。从1997年6月起,至2019年6月,四个regime共出现146次,其中两指标双上行28次,双下行41次,基本面与流动性指标上行而换手率指标下行37次,基本面与流动性指标下行而换手率指标上行40次。


基本面与流动性

指标上行

基本面与流动性

指标下行

换手率指标上行

28次

40次

换手率指标下行

37次

41次

对于风险溢价框架的日频指标组合,我们首先对其日频数据进行了滤波处理,然后根据单个指标的上下行情况划分周期,具体步骤如下:

  • 由于每个指标的历史时间序列中包含很多信息,包括趋势、季节性波动、周期、噪音等,我们对划分指标进行了HP滤波,得到其趋势项:

  • 对每个指标的趋势项进行“上行”和“下行”的划分,只要趋势斜率为正即为上行,斜率为负即为下行;

  • 综合两个指标的上下行情况,划分出2*2共4种regime,即:ERP上行且A股日换手率上行,ERP上行而A股日换手率下行,ERP下行而A股日换手率上行,ERP下行且A股日换手率下行,得到regime划分结果如下:


    图中周期划分较为均匀,大部分周期每次出现只会持续1至2个月,四个regime一共出现了123次,其中除了ERP上行且A股日换手率上行这一regime出现了30次,其余三种regime各出现了31次。


风险溢价指标

上行

风险溢价指标

下行

换手率指标上行

30次

31次

换手率指标下行

31次

31次

2   因子适应度评价与筛选

Regime划分是私募产品分类法的第一步,接下来需要根据regime对私募产品分类工具—因子,进行适应度评价和筛选。只有适用于现有regime框架的因子,才能继续履行为私募产品贴标签的使命。

评判的标准为因子在各个regime上行和下行次数的分化程度。当我们能预判未来的regime时,但因子在该regime的历史中上行和下行次数相差不大,我们将很难判断预测出的regime里因子会上行还是下行,进而也无法判断在这个因子上暴露较多的私募产品将会有什么样的表现。因此在各个regime上、下行分化不明显的因子,我们考虑将其剔除。我们为判断一个因子在regime中走势分化程度建立了一个定量指标,以加权分数的形式表示,具体计算如下:

其中,周期发生概率为权重,权重以外的部分表示了因子在每个周期的分化情况,称为适应度得分。若因子在一个周期的历史中全部上行(或全部下行),则分子部分等于分母部分,该得分为1;若因子在一个周期的历史中有一半上行,一半下行,则分子部分为0,得分也为0。因此因子在regime中上、下行次数分化越明显,得分越高。

我们选取了况客十因子以及第三方因子库的超过两百个因子作为备选因子库,对其中所有因子进行了适应度评价与筛选。

根据overall-score的定义,我们对所有因子计算了其等权重加权(4个regime发生概率均为0.25)的分数值并从大到小排列,过滤掉了所有分数低于0.25分的因子。阈值设置为0.25是由于若因子在至少一个regime上得分为1(该regime历史中全部上行或全部下行),则该因子得分将不低于0.25(得分1*概率0.25),也是意味着平均而言,该因子至少要在一个regime上有适应性。

以下为两个框架因子总分排名前十位的因子,根据上述打分规则,分数越大的因子越适用于当前框架,满分为1:

从因子打分的结果就能看出两个框架的侧重点各有不同。基本面与流动性框架中表现较好的因子,如每股营业利润,经营活动净收益等都能与该框架的基本面指标“工业企业利润累计同比-M2同比”相联系。而风险溢价框架中,动量类因子5日终极指标TRIX,BETA因子等则反映了因子表现与框架指标ERP的相关性。两个框架均有换手率这一指标,在排名前十的因子中有不少是与换手率有关的因子,例如日频框架中排名最高的因子即10日平均换手率,60日平均换手率因子。

从筛选出来的因子类型来看,其与我们所设定的regime框架有着逻辑上的内在一致性。进一步说明了基于regime框架做因子筛选和管理人标签的合理性。

因子过滤完成后,我们因子库中的因子数量从原本的近300个减少了约一半,但这些筛选出来的因子无论从数量上还是种类上都仍不适用于产品的标签分类,颗粒度太细,还需要对因子进行聚类与数据处理。

3   因子聚类与数据处理

在私募产品分类法的体系中,因子充当的角色是为私募产品贴标签和分类的辅助工具,最终目的在于方便评价、总结各个私募产品的特性,因此对于因子有如下要求:

  • 因子数量不宜过多:私募数据具有历史数据少,更新频率低的特点,而在对私募产品贴标签时涉及到滚动回归,在样本数少的情况下,自变量(因子)数量过多会影响回归结果;

  • 不同因子尽量覆盖不同方面,以求在对产品进行归因和贴标签时能更加全面地捕捉到其风格暴露。

  • 每类因子涵盖面广,而不是细节指标。若大类因子的子因子少且细节化,那么这个大类因子将很难用于“泛化”。例如,若用于打标签的动量类因子只包含了一个20日乖离率,那么这类因子只能捕捉在20日乖离率上有暴露的产品,而在除20日乖离率以外动量类因子上有暴露的产品就不能被捕捉到了。

基于这些条件,我们考虑对过滤后的因子进行聚类处理。

由于整套分类体系都以Regime作为基础,在因子聚类上也应保持关注其在周期上的变化。因此我们没有根据因子相关性对因子进行分类,而是将因子适应度评价中的适应度得分作为特征变量并使用K-means方法进行聚类。这里的适应度得分没有做绝对值处理,目的是对上、下行次数差值相同但方向不同的因子进行区分,即:

每个框架有四个regime,因此一个因子在每个框架下都有一个(d1,d2,d3,d4)的四维数据,我们在此基础上使用K-means聚类方法对因子进行聚类。

风险溢价框架下筛选出的121个因子以及基本面与流动性框架下的98个因子各分出了9个大类。有意思的是,这些大类因子又一次反映出了两个框架不同的侧重点。

在基本面与流动性框架下基本面因子被划分得较为细致。聚类得到的9类因子中有3类均为公司盈利相关的因子,根据其子因子的特点,我们将它们命名为盈利类因子、盈利稳定性因子以及盈利质量类因子。

而风险溢价框架中,聚类后的结果则侧重于量价类因子的细分。比如动量相关的因子,我们看到不同时间窗口的因子恰好被聚类为不同的类别:

(中期)价格动量类因子

(短期)价格动量类因子

60日乖离率

20日乖离率

10日终极指标TRIX

5日终极指标TRIX

当前股价除以过去三个月股价均值再减1

当前股价除以过去一个月股价均值再减1

24日收盘价格与日期线性回归系数

12日收盘价格与日期线性回归系数

表格截取了风险溢价框架下划分出的两种动量类的部分子因子。可以看出两列的因子差别仅在于期限的不同,左列指标的期限比右列更长,例如60日与20日乖离率对比,10日与5日终极指标TRIX对比等。根据子因子的特征,我们将这两个大类分别命名为(中期)、(短期)价格动量类因子。

根据聚类结果,我们将同属一个大类的因子进行等权重复合,计算出复合因子的净值与累计收益率,并根据子因子特点进行了命名(下图分别为两个框架下的因子走势):

从图中可以看出,两种框架下聚类出的复合因子种类和走势都有一定区别,如果同时使用这两种框架对私募产品进行标签分类将能从不同角度捕捉私募产品的风格暴露情况。

4   私募产品的标签与分类

上一步结尾得到的复合因子已经能够满足第三部分开头提到的对于私募产品标签分类工具的要求,这些复合因子数据可以作为打磨好的工具,进入最后的贴标签与分类步骤。

我们剔除了况客私募清洗库中两两相关性过高且数据缺失较多的私募产品,最终对875产品进行了标签分类(具体方法请见《况客私募基金投资解决方案与因子推断标签》)。

我们用排第一位的标签来进行产品分类,以下为况客清洗库中各类产品的数量:

从表格中可以得到以下结论:

  • 无论哪种框架,所有通过过滤、聚类、复合出的大类因子均在标签第一位中出现过,即没有因子是多余的。

  • 产品风格暴露较为集中,大部分产品都在风险厌恶类因子(基本面与流动性框架)和规模类因子(风险溢价框架)上暴露较多。

  • 不同Regime框架的分类集中度不同,例如基本面与流动性框架标签集中在风险厌恶类、交易活跃度类以及规模类因子上,而风险溢价框架标签集中在规模类、波动率类以及成长类因子上,这说明有不同侧重的Regime框架确实能够从不同角度捕捉私募产品的风格暴露。

整套基于Regime的私募产品标签分类体系中的每一步都能体现出框架构建对后续步骤的影响,无论是因子打分过滤、因子聚类复合,还是产品标签分类均是如此。而从Regime构建开始到标签分类环环相扣的推导逻辑,也为后续自上而下地评价、预测、配置私募产品提供了依据。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多