分享

招商证券:量化投资策略选股模型

 Lilac79 2014-03-01

 

一:量化选股模型

1、三个基本选股模型:

A、价值模型V:以PE-PB-PCF 为价值因子

B、成长模型G:以EBITG-NPG-MPG-GPG-OPG为成长因子

C、质量模型Q:以ROA-ROC-GPM-CRAR-CNPR-TAT 为质量因子

 

1.1、选股方式——自下而上选股

基本选股模型采用指标打分的方法来筛选股票。首先对待选股票的各个指标分别进行排序打分,然后将股票对应各个因子的指标得分进行求和,最后以总得分大小来筛选股票和构建组合。具体步骤如下:

第一步:确定待选股票池。选择组合构建时点(每个月最后一个交易日收盘后)上市满两年的全部A 股股票,考虑实际投资需求,剔除当日停牌的股票,剔除最近四个季度滚动净利润为负值的股票,剔除连续3 个交易日平均成交额小于100 万元的股票后,以剩余股票作为待选股票池。

第二步:构建股票组合。

a) 指标打分:首先将待选股票池中股票分别按照属性因子的各个指标进行排序(价值指标从小至大,成长指标和质量指标从大至小),然后采用百分制整数打分法进行指标打分,即以股票在各个指标排名中所处位置的百分数作为股票对应该指标的得分,前1%得分为1,依次递减,最后1%得分为100。

b) 求和排序:将股票相对于同一属性的各个指标的得分进行等权重求和,将总得分进行从小至大排序,选择排名靠前的N 只股票进入量化组合。

c) 构建组合:采用等市值权重构建相应的量化组合(采用等权重的方法可以比较选股效果的优劣,在实际的投资中也可采用其他权重)。

第三步:组合调整。我们对组合进行逐月调整(调整时扣除相应的交易税费,暂不考虑冲击成本),即持有组合至次月最后一个交易日,利用更新后的指标数据重新确定待选股票池,重复第二步打分、求和过程,并将股票按照指标得分和值从小至大排序,将原来量化组合中排名跌出前N 名的股票卖出,买入新进前N 名的股票,同时将新组合内样本股的权重调整至相等。

第四步:统计检验。分别计算各组合每个月收益情况,以沪深300 指数作为比较基准,利用t 检验考察各个量化组合超额收益的有效性。并用信息比率、夏普比率和战胜基准频率来比较各种策略的优劣。

需要说明的是:由于采用自下而上的选股方法,因此在筛选指标过程中,我们尽量选择那些所有股票均可计算的指标(比如ROIC 指标由于银行类股票不能计算,我们将其剔除,并选择ROC 指标来替代),以避免出现某些行业由于指标无法有效计算而不能被选入的情况。另外,我们主要选择那些可以明显分别出优劣的指标,以便进行排序(比如资产负债率等指标不能通过简单的排序来区分股票好坏,因此不予采用)。

1.2、价值模型——寻找估值凹地

量化价值模型寻找低估值的股票构建组合。在前面的研究报告《量化投资系列之价值模型——寻找价值凹地》中,我们以PCF 单指标来构建价值模型。近期,我们重新考虑了包括PE(市盈率)、PB(市净率)、PCF(市现率)、PS(市销率)、PEE(一致预期市盈率)和EV/EBITDA(企业价值倍数)等在内的六个市场估值指标的选股情况,并利用2002 年1 月~2009 年11 月,接近八年时间共计95 期数据进行更新测试。结果表明,以PE-PB-PCF 三个指进行联合打分选股,所得到的价值组合更加出色和稳定。

表1:价值指标及其定义

价值指标

名称

定义

PE

市盈率

总市值/滚动12 个月净利润

PB

市净率

总市值/最近报告期净资产

PCF

市现率

总市值/滚动12 个月经营活动净现金流

 

分别以得分排名的前20%10%50 只股票构建价值组合,其在2002.1~2009.11 的测试期内,相对沪深300 指数的超额收益均可通过95%置信度下的统计检验,其中10%组合和50 只组合的统计检验置信度达到99%以上。

1.3、成长模型——挖掘成长伏藏

量化成长模型选择高成长性的股票构建组合,在前面的研究报告《量化投资系列之成长模型——ROIC-NPG:挖掘成长伏藏》中,我们以ROIC-NPG 两个指标来构建成长模型。根据我们对各项指标的重新梳理,现将ROIC 列为质量指标,另外构建了包括EBITG(息税前收益增长率)、NPG(净利润增长率)、MPG(主营利润增长率)、GPG(毛利润增长率)、OPG(营业利润增长率)、OCG(经营现金流增长率)、NAG(净资产增长率)、EPSG(每股收益增长率)、ROEG(净资产收益率增长率)、GMPG(毛利率增长率)等十个考核公司成长能力的指标。根据2002 1 ~2009 11 月,接近八年的时间共计95 期数据的更新测试。结果表明,以EBITG-NPG-MPG-GPG-OPG-OCG 六个指标进行联合打分选股,所得到的成长组合表现最优。

3:成长指标及其定义

价值指标

名称

定义

EBITG

息税前收益增长率

本期滚动12 个月息税前利润/上期滚动12 月息税前利润-1

NPG

净利润增长率

本期滚动12 个月净利润/上期滚动12 月净利润-1

MPG

主营利润增长率

本期滚动12个月主营业务利润/上期滚动12月主营业务利润-1

GPG

毛利润增长率

本期滚动12 个月销售毛利润/上期滚动12 月销售毛利润-1

OPG

营业利润增长率

本期滚动12个月营业利润/上期滚动12月营业利润-1

OCG

经营现金流增长率

本期滚动12个月经营性现金流净额/上期滚动12月经营性现金流净额-1

 

分别以指标排名的前20%10%50 只股票构建成长组合,其在2002.1~2009.11 的测试期内,相对沪深300 指数的超额收益均可通过90%置信度下的统计检验,其中10%组合的统计置信度达到97%50 只组合的统计检验置信度达到99%

1.4、质量模型——甄选优质蓝筹

量化质量模型选择资质优异的公司股票构建组合。我们从六个方面的财务指标来考察公司的资质,包括偿债能力、经营能力、营运能力、现金流质量、盈利能力、分红能力等。采用ROA(总资产收益率)、ROE(净资产收益率)、ROC(资本报酬率)、OPM(营业利润率)、GPM(销售毛利率)、现金流指标、COIR(现金营业收入比率)、CTAR(现金总资产比率)、CNPR(现金净利润比率)、TAT(总资产周转率)、LAT(流动资产周转率)等十个指标来进行股票的筛选。根据2002 1 ~2009 11 月,接近八年的时间阶段,共计95 期数据的测试。结果表明,以ROA-ROC-GPM-CRAR-CNPR-TAT六个指标进行联合打分选股,所得到的质量组合表现最优。

5:质量指标及其定义

价值指标

名称

定义

ROA

总资产收益率

滚动12个月净利润×2/(期初+期末总资产)

ROC

资本报酬率

滚动12个月净利润/(股东权益+长期负债)

GPM

销售毛利率

滚动12个月销售利润/滚动12个月销售收入

CTAR

现金总资产比率

滚动12个月经营现金流净额×2/(期初+期末总资产)

CNAR

现金净利润比率

滚动12个月经营现金流净额/滚动12个月净利

TAT

总资产周转率

滚动12个月营业总收入×2/(期初+期末总资产)

 

分别以指标排名的前20%10%50 只股票构建质量组合,其在2002.1~2009.11 的测试期内,相对沪深300 指数的超额收益均可通过95%置信度下的统计检验,其中,10%50 只组合获得超额收益的概率更高,通过统计检验的置信度都在99%左右。

2. 五个衍生模型

2.1、四个叠加模型

通过对股票的价值、成长和质量三个属性因子的指标进行分类排序打分,我们分别得到价值模型、成长模型和质量模型三个基本选股模型,利用这些模型,我们可以筛选出低估值的股票组合、高成长的股票组合以及资质优秀的股票组合,从历史统计检验结果来看,这些量化组合都能显著战胜基准指数。

但是,三个基本模型只侧重股票某一方面的属性,而通过将三种属性进行叠加,就可以得到同时具备几个属性优势的股票组合,例如,选择价值属性和成长属性同时优秀的股票构建组合,就可以得到价值成长模型1。通过对股票各种属性因子进行联合打分选股,可以得到四个叠加模型,分别为价值成长模型(VG)、价值质量模型(VQ)、成长质量模型(GQ)和价值成长质量模型(VGQ)。

根据前面三个基本选股模型的研究结果,这里采用PE-PB-PCF 作为股票价值属性因子的度量指标;以EBITG-NPG-MPG-GPG-OPG 作为股票成长属性因子的度量指标;以ROA-ROC-GPM-CRAR-CNPR-TAT 作为股票质量属性因子的度量指标。并以此来构建四个叠加模型。

叠加模型的选股流程与基本模型类似,只是在第二步构建股票组合中,首先需要对待选股票的各个指标进行排序打分,然后将同一属性因子的指标得分进行相加,即可得到属性因子得分,再将各个属性因子得分进行加权求和,就可得到最终的量化分值,最后选择量化分值最小的股票即可构建相应的叠加组合。在组合调整时也进行同样的操作。

 

 

通过对叠加模型的属性因子权重进行了包括动态调整和静态配比在内的各种优化测试,结果显示,以固定的比例进行属性因子叠加所得到的组合表现相对稳定。具体来说:价值成长模型和价值质量模型的属性因子比重均为55,成长质量模型的属性因子比重为73,价值成长质量模型的属性因子比重为334。即各种叠加模型构成为:

VG=0.5*V+0.5*G;

VQ=0.5*V+0.5*Q;

GQ=0.3*G+0.7*Q;

VGQ=0.3*V+0.3*G+0.4*Q;

分别以得分排名的前20%10%50 只股票构建四个叠加组合,其在2002.1~2009.11的测试期内,相对沪深300 指数的超额收益均可通过95%置信度下的统计检验,其中,20%VQG 组合和10%50 只股票所有叠加组合的统计检验置信度均达到99%。可见,这些叠加模型的有效性是非常高的。

从风险收益上看,四个叠加组合相对各自基本模型的组合都有不同程度提升,尤其是VGQ 组合,无论从绝对收益,还是风险调整收益角度来看,都是表现最优的;但从战胜基准频率角度来看,VGQ 组合略微低于价值组合,可见VGQ 组合也并非是完美的。

2.2GARP 模型

GARPGrowth at a Reasonable Price)投资策略是继价值投资和成长投资之后最为热门的投资策略之一,它将上市公司的价值属性和成长属性紧密结合,试图通过以相对较低的价格买入具有较高成长性的公司来获得更为稳定的超额收益。该策略的典型代表是投资大师彼得林奇(Peter Lynch),他利用这种方法在1977 1990 的十三年间创造了年平均收益率高达29%的传奇业绩。

在量化形式上,GARP 策略一般首先对股票的价值属性和成长属性分别进行排序打分,然后选择同时位于价值排名和成长排名前列的股票构建组合。根据前面对价值模型和成长模型的更新,这里利用PE-PB-PCF 三个指标来对股票的价值属性进行量化测度,用EBITG-NPG-MPG-GPG-OPG-OCG 六个指标对股票的成长属性进行量化测度,然后取价值型股票和成长型股票的交集,即同时具有较高价值属性和成长属性的股票等权重构GARP 组合。

从统计结果来看,从3%30%交叉情况下的组合超额收益均可通过90%置信度下的统计检验,而从5%26%交叉情况下的组合超额收益的统计检验置信度达到99%,显示出GARP策略具有宽范围的选股有效性。

从风险和收益角度来看,随着交叉深度的提高,组合的收益有先变大后表现的变化趋势,相对来说,8%交叉深度下的组合表现最为出色,其月均超额收益超过2.3%,信息比率达到1.54,夏普比率超过1,战胜沪深300 指数的频率也接近70%,但是该组合含有的股票数量较少,最多月份含有20 只股票,最少只有2 只股票,平均持有股票9 只。这里我们将其命名为积极GARP 组合(aGARP)。

另外选择股票个数相对较多,表现也不错的18%交叉深度构建稳健GARP 组合(sGARP)。该组合月均收益达到3.1%,信息比率、夏普比率和战胜基准频率也都差强人意。而且组合中股票个数大大增加,测试期内,最多含有股票55 只,最少也有23只,平均持股37 只,完全可以满足一些大资金的投资需求。

二、量化组合及特征分析

1.股票个数选择

股票组合的市场风险由系统性风险和非系统性风险组成,其中系统性风险不可分散,而非系统性风险可以通过增加股票个数来减少,即实现风险分散化。但是,股票组合的持股数量并不是越大越好。一方面,当组合股票数目增加至一定程度,对非系统性风险的边际降低程度会递减,而随之带来较高的交易费用及管理成本问题却已开始蚕食组合收益率;另一方面数目众多的证券组合中可能包含一些无法及时得到相关信息且收益较低的证券,从而增加了及时有效进行投资组合调整的难度。因此需要在分散风险和提高收益之间寻找一个平衡点。

我们采用Evans and Archer 的方法对组合的分散化程度进行度量。具体方法如下:

 

 

 

图12 给出了不同规模股票组合残余可分散风险占比,从中可以看出,随着组合规模的不断增大,残余可分散风险占比逐渐下降,同时可分散风险占比的下降速度也逐渐减小。

当组合规模数达到38 只时,沪深300 样本组合的残余可分散风险下降到了1%以内;当组合规模数达到41 只时,中小板样本以及基金持股样本的残余可分散风险占比下降到了1%以内;当组合规模达到45 只时,全市场样本的残余可分散风险占比也下降到1%以内。

由于我们量化组合的股票是从全市场样本中选择的,因此为分散组合风险,需要将股票个数控制在45 个以上。而从实际的选股模型对组合股票个数的敏感性分析来看,当股票个数大于40 个、小于60 个时,组合历史测试的业绩表现相对出色和稳定。以价值模型为例(见表9),当股票个数较少时,组合的月均收益最好,但波动较大,随着股票个数增加到40 个以上时,组合的表现趋于稳定,而当股票个数大于60 个后,组合又开始变差。

此外,从国内公募基金的持股情况来看,其公布的平均持股数量在60 只左右,而实际的重仓股一般控制在50 个以内。

综上所述,我们认为,以50 只股票来构建量化组合是合适的,既能有效分散风险,最大获得收益,又能满足基金等机构投资者的建仓和持股需要。

2.十个量化组合

前面,我们以自下而上的选股方式,构建了三个基本选股模型和五个衍生选股模型,其指标和参数是通过近8 年的历史数据测试分析得出,但是这些指标并非一成不变,今后,我们每年将对这些选股模型进行定期更新测试,并相应调整选股指标及相关参数。

根据三个基本模型和四个叠加模型,我们以50 只股票分别构建出价值组合(V50)、成长组合(G50)、质量组合(Q50)、价值成长组合(VG50)、价值质量组合(VQ50)、成长质量组合(GQ50)和价值成长质量组合(VGQ50)。

根据交叉深度为8%和18%的GARP 模型,我们分别构建了积极GARP 组合(aGARP)和稳健GARP 组合(sGARP),这两个组合的股票个数不是固定的,其中,aGARP组合统计期间最大持股数为20 只,最少为2 只,平均持股9 只。sGARP 组合统计期间的最大持股数为55 只,最少为23 只,平均持股37 只。

此外,考虑到一些中小投资资金的需求,我们利用VGQ 模型构建了一个只含有十只股票的VGQ10 组合。从历史统计检验上看(见表11),VGQ10 组合相对沪深300 指数的超额收益可以通过99%置信度下的t 检验,而且从风险收益上看也表现卓越。

3.组合特征分析

上述十个量化组合分别来自于八个选股模型,虽然从历史统计检验的角度来看,各个组合都是有效和可靠的,但由于各个模型本身的侧重点和选股方式不一样,也使得的量化组合会产生不同的特点,有着不同的收益预期,适合不同的投资者。下面,我们从风险收益特征、组合相关性和市场容量等几个方面对十个组合进行比较分析。

风险收益特征

从2002 年1 月到2009 年11 月近8 年的历史月度收益数据来看,十个量化组合相对沪深300 指数均取得了显著的超额收益(见表12)。其中,股票个数较少的aGARP 组合和VGQ10 组合相对沪深300 指数的月度超额收益都超过了2%,它们也同时获得了最高的累计收益,分别达到1794%和1485%,远远高于同期沪深300 指数161%的累计涨幅,但同时,两个组合收益的波动性也最大,其年化标准差分别达到41.5%和43.3%。

从Beta 系数上看,两个少数股票组合aGARP 和VGQ10 最大,都超过1.1,而Q50和GQ50 两个组合的Beta 值小于1,其余组合的Beta 值都介于0.9 和1 之间。从最大涨跌幅度来看,无论是按单月还是半年计算,Q50 和GQ50 组合都是相对较小的,这与他们的Beta 系数较小有关。而V50 表现相对出色,牛市能涨,熊市抗跌。

从战胜沪深300 指数频率来看,aGARP 组合表现最好,接近70%,其次是V50 组合,达到68.4%,此外,VG50、VQ50 和VGQ50 组合也都接近2/3,只有G50 组合最差,不到60%。如果将组合的投资时间增加,则战胜基准的频率将显著提高(见表13)。从历史测试结果来看,滚动投资组合1 年时,十个量化组合均可在90%以上的概率战胜沪深300 指数,其中持有aGARP 组合战胜指数的概率达到100%。

如果以会计年度计算组合收益(见表14),在测试的8 年(2009 年为前11 个月数据)时间里,除了G50 组合在2003 年和V50、VG50、VGQ50 及sGARP 组合在2006 年跑输指数以外,其余年份里各个组合均获得沪深300 指数的超额收益,尤其是Q50、GQ50、aGARP 和VGQ10 四个组合连续八年战胜沪深300 指数。

从不同市场行情表现来看(见表15),十个组合均可获得相对沪深300 指数的超额收益。其中,G50 和VQ50 组合在牛市行情下的超额收益要明显大于熊市,显示出很强的进攻特性;而Q50 和GQ50 组合在熊市里的超额收益大于牛市,表现出较好的防御特性;V50、VG50、VGQ50 和sGARP 四个组合在牛市和熊市里的超额收益差别不大,但都好于调整行情。aGARP 和VGQ10 两个组合在三种市场行情下的超额收益都非常大,不过相对来说牛市行情仍然更为出色。

利用沪深300 指数的历史月度收益率数据将市场分为上升市场和下降市场,来看不同市场环境下各个量化组合的风险收益特征(见表16)。

在上升市场中,除V50 外,其余组合的Alpha 均大于1%,其中GQ50 组合的Alpha接近2%。从Beta 角度来看,V50、sGARP 以及VGQ50 的Beta 系数较大,而G50、Q50 以及GQ50 的Beta 系数均小于1。由于Beta 系数较小,上升市场中Q50 和G50战胜沪深300 的频率都较低,不到60%,而V50、VG50 以及sGARP 战胜市场的频率到超过70%。

在下降市场中,sGARP 和GQ50 的Alpha 均超过2%,V50 的Alpha 较小,不到0.3%。

从Beta 角度来看,V50、aGARP、Q50 以及VGQ50 的Beta 系数都小于1,由于Beta系数较小,除aGARP 外其余3 个组合在下降市场中战胜沪深300 的频率都较高。而CQ50 由于Alpha 较大而Beta 较小,在下降市场中战胜沪深300 的频率最高,达到72.97%。

将量化组合的Beta 和Alpha 表示在一个图中(见图13、14),我们可以明显看到,下降市场中Q50 组合表现最好,它的Alpha 较大,但Beta 较小,这样即可有效对抗市场下跌风险,又能获得稳定超额收益。而在上升市场中,应该优先选择aGARP、VGQ10、sGARP 等组合,他们不但Beta 大,而且Alpha 收益也高,这样可以在市场上升趋势中更大幅度的超越指数。

组合相关性分析

从绝对收益角度看,由于A 股市场系统性风险较大,各个量化组合也表现出与市场齐涨齐跌的现象,10 个量化组合只有VGQ10 与沪深300 指数月收益率的相关系数低于0.9(见表17)。量化组合绝对收益率之间的相关性也较大,除V50 与GQ50 以及V50与VGQ10 之间相关系数为0.88 和0.89 外,其余组合间相关系数均大于0.9。

由于十个量化组合分别代表不同的风格,所以从相对沪深300 指数的超额收益角度来看,不同组合间的相关性要远小于绝对收益间的相关性(见表18)。其中V50 与GQ50超额收益间相关性最小,相关系数仅为0.19。

组合市场容量

由于量化组合对选中的股票进行等权重配置,若组合中包含的某些股票流动性较差,在实际的投资中可能会对组合的构建造成一定的影响。为此,我们根据木桶原理,以组合中流动性最差的股票所能建仓的资金量来测算组合的市场容量。

对于每一个量化组合,假设组合中流动性最差的股票在构建组合当日所有成交量全部被买入,则将其成交金额数乘以组合股票个数即是组合所能容纳的资金量。实际中,买入某一股票某天的全部成交量不太现实,投资时可以选择流动性好的股票当天成交,部分流动性较差的股票分几天建仓来实现。假设组合中所有股票均分5 天建仓,则建仓期的延长可能对组合的建仓成本造成影响。经过我们测算,如果组合中所有股票均分5 天平均建仓,则建仓期的延长对组合月平均收益的影响大约在20 个BP 左右(见图15)。

 

用最近6 个月组合容量的平均值表示当前量化组合的市场资金容量,则V50、Q50、VG50、VQ50、GQ50 的资金容量均在7 亿以上,G60 和VGQ50 的资金容量在6 亿以上,sGARP 的资金容量在4 到5 亿间,aGARP 和VGQ10 由于包含股票较少,市场容量均在2 到3 亿间。

组合特征比较

参考各个组合的历史表现,我们分别以测试期间的月均收益、标准差、战胜指数频率来衡量组合的预期收益、波动性和稳定性,以组合历史上不同市场行情下的表现来考核组合所适合的市场行情,并以组合市场容量来表示其所能容纳的投资资金(见表19)。从比较结果来看,各个组合各有所长,投资者可根据自身情况和市场预期进行选择。

三、总结与组合推荐

总结

我们以自下而上的选股方式,分别构建了八个量化选股模型,通过不同的参数选择,构建出十个量化组合。

1)从历史统计检验结果来看,各个量化选股模型都是显著有效的。量化选股的主要目标是战胜比较基准,即沪深300 指数,而通过对各个选股模型采用近八年的历史数据进行实证检验,结果表明这些选股方式是有效和可行的,尤其是以50 只或较少的股票构建组合时,其相对沪深300 指数的超额收益都能通过99%置信度下的统计检验。

2)从历史模拟测试效果来看,量化组合的表现是稳定和出色的。在接近八年的历史模拟测试中,根据八大选股模型所构建的十个量化组合都获得了远远超越沪深300 指数的累计收益,尤其是股票数量较小的aGARP 和VGQ50 组合,其累计收益和月均收益都数倍于指数。即使以风险调整收益夏普比率来看,十个量化组合中有三个达到沪深300 指数两倍以上,另外七个也都超过1.7 倍。

3)十个量化组合具有不同的风险收益特征,适合不同的市场环境和投资需求。从收益、风险、稳定性以及不同市场行情,不同时间阶段的表现来看,各个量化组合各有特点。比如质量模型的稳定、价值模型的抗跌、成长模型的激进以及各个叠加模型的攻守平衡等,总之,根据投资者的风险偏好,可以利用这些模型设计不同的投资产品。

4)量化选股模型构建并非一劳永逸,选股方式和模型参数亟待不断完善。今后我们将对量化选股模型继续进行深入研究。一方面,探讨市场动量反转效应以及股票交易特征等因素对选股模型的影响,以期对模型进行改进;另一方面,持续跟踪十个量化组合的实际表现,通过量化月报的形式,及时总结组合表现,给出新的组合。

组合推荐

参照各个量化组合历史模拟测试所表现出来的风险收益特征,考虑目前所处的市场环境,我们认为中小投资资金可以优先考虑aGARP 和VGQ10 组合,其中aGARP 组合更值得关注,而较大规模的资金可以在V50 以及四个叠加模型中进行选择,我们优先推荐VG50 和VGQ50 组合。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多