量化投资模型系列之GARP.docx
- 文档编号:11531562
- 上传时间:2023-03-18
- 格式:DOCX
- 页数:16
- 大小:27.72KB
量化投资模型系列之GARP.docx
《量化投资模型系列之GARP.docx》由会员分享,可在线阅读,更多相关《量化投资模型系列之GARP.docx(16页珍藏版)》请在冰豆网上搜索。
量化投资模型系列之GARP
量化投资模型系列之 GARP
:
量化投资模型的建立方法,首先要建立股市信息统计分析的基础,量化投资模
型进行历史数据的模拟验证,成功率超过 80%,在实战中监控量化投资模型。
如何建一个量化投资模型,给大家说方法.
(1)首先要建立股市信息统计分析的基础,从大量的数据中通过数据挖掘
找出赚钱股票的内部联系。
找出进入点和退出点的基本特征。
有些比较简单的统
计分析就可以发现规律,有些复杂的模型,需要用到数理统计的聚类分析等算法,
最大信息熵,人工智能等多种理论。
不过说实话,简单的模型大多不好用,因为
这个世界聪明的人多,都能发现的模型,估计有效性就不够。
这也是为什么有效
的模型,使用的人越少,便越有效。
(2)量化投资模型进行历史数据的模拟验证。
2 个星期做到 5%的收益,至
少要达到所有历史数据(包含历史上的所有时期,不仅仅包含牛市数据,而且也
要包含熊市数据。
)有效率超过 80%。
这个是我对模型有效的最基本要求。
当然,
你也可以做出一个模型,每个星期赚 10%。
俺曾经尝试过这个模型,貌似很难有
很高的成功率。
对模型而言,我觉得交易稳健也很重要。
所以,我降低了收益率,
提高交易的成功率。
实际上,稳健盈利的交易模型,给你交易带来最后实际的成
功率,一般来说远远高于 5%。
(3)如果你的量化投资模型在实验过程中盈利的成功率超过 80%,你就可
以进行实战模拟验证了。
经过三个月实战模拟验证,再对操作中模型出现的问题
进行校正。
如果模型能让你 10 笔交易的胜率超过 8 笔以上,那你就可以加仓。
(4)在实战中监控量化投资模型。
如果某一个阶段,连续发生模型 3 次交
易失败的事情,就要停止操作,重新观察模型,分析模型失败的原因。
重新回到
步骤 1,开始修正模型,再重新进行 2-4 的步骤。
当然,对于股市而言,量化投资模型就是量化投资的精华。
如果有了它,你
根本不要关注消息面,新闻面,以及传闻。
唯一所做的事情,就是面对模型,按
照模型操作。
当然,如果你的模型有新闻传闻这些影响因子,那就要关注了。
平时多做一些不同类型的模型,方便自己的交易。
当然,有效的交易模型很
难找,手上有 1 个有效的模型,就不愁财富了。
当你的量化投资模型越来越多,
财富便自然而然的向你奔涌来。
一:
量化选股模型
1、 三个基本选股模型:
A、价值模型 V:
以 PE-PB-PCF 为价值因子
B、成长模型 G:
以 EBITG-NPG-MPG-GPG-OPG 为成长因子
C、质量模型 Q:
以 ROA-ROC-GPM-CRAR-CNPR-TAT 为质量因子
1.1、选股方式—— 自下而上选股
基本选股模型采用指标打分的方法来筛选股票。
首先对待选股票
的各个指 标分别进行排序打分,然后将股票对应各个因子的指标得分
进行求和,最后以总得分大小来筛选股票和构建组合。
具体步骤如下:
第一步:
确定待选股票池。
选择组合构建时点(每个月最后一个
交易日收盘后)上市满两年的全部 A 股股票,考虑实际投资需求,剔
除当日停牌的股票,剔除最近四个季度滚动净利润为负值的股票,剔
除连续 3 个交易日平均成交额小于 100 万元的股票后,以剩余股票作
为待选股票池。
第二步:
构建股票组合。
a) 指标打分:
首先将待选股票池中股票分别按照属性因子的各
个指标进行排序(价值指标从小至大,成长指标和质量指标从大至小)
,然后采用百分制整数打分法进行 指标打分,即以股票在各个指标排
名中所处位置的百分数作为股票对应该指标的得分,前 1%得分为 1,
依次递减,最后 1%得分为 100。
b) 求和排序:
将股票相对于同一属性的各个指标的得分进行等
权重求和,将总得分进行从小至大排序,选择排名靠前的 N 只股票进
入量化组合。
c) 构建组合:
采用等市值权重构建相应的量化组合(采用等权
重的方法可以比较选股效果的优劣,在实际的投资中也可采用其他权
重)。
第三步:
组合调整。
我们对组合进行逐月调整(调整时扣除相应
的交易税费,暂不考虑冲击成本),即持 有组合至次月最后一个交易
日,利用更新后的指标数据重新确定待选股票池,重复第二步打分、
求和过程,并将股票按照指标得分和值从小至大排序,将原来量化组
合中排名跌出前 N 名的股票卖出,买入新进前 N 名的股票,同时将新
组合内样本股的权重调整至相等。
第四步:
统计检验。
分别计算各组合每个月收益情况,以沪深 300
指数作为比较基准,利用 t 检验考察各个量化组合超额收益的有效性。
价值指标
名称
定义
PE
市盈率
总市值/滚动 12 个月净利润
PB
市净率
总市值/最近报告期净资产
PCF
市现率
总市值/滚动 12 个月经营活动净
现金流
并用信息比率、夏普比率和战胜基准频率来比较各种策略的优劣。
需要说明的是:
由于采用自下而上的选股方法,因此在筛选指标
过程中,我们尽量选择那些所有股票均可 计算的指标(比如 ROIC 指
标由于银行类股票不能计算,我们将其剔除,并选择 ROC 指标来替代)
,以避免出现某些行业由于指标无法有效计算而不能被选入的情况。
另外,我们主要选择那些可以明显分别出优劣的指标,以便进行排序
(比如资产负 债率等指标不能通过简单的排序来区分股票好坏,因此
不予采用)。
1.2、价值模型 ——寻找估值凹地
量化价值模型寻找低估值的股票构建组合。
在前面的研究报告
《量化 投资系列之价值模型——寻找价值凹地》中,我们以 PCF 单指
标来构建价值模型。
近期,我们重新考虑了包括 PE(市盈率)、
PB(市净率)、PCF(市现率)、PS(市销率)、PEE(一致预期市盈
率)和 EV/EBITDA(企业价值倍数)等在内的六个市场估值指标的选
股情况,并利用 2002 年 1 月~2009 年 11 月,接近八年时间共计 95
期数据进行更新测试。
结果表明,以 PE-PB-PCF 三个指进行联合打分
选股,所得到的价值组合更加出色和稳定。
表 1:
价值指标及其定义
分别以得分排名的前 20%、10%和 50 只股票构建价值组合,其在
2002.1~2009.11 的测试期内,相对沪深 300 指数的超额 收益均可通过
95%置信度下的统计检验,其中 10%组合和 50 只组合的统计检验置信
度达到 99%以上。
1.3、成长模型——挖掘成长伏藏
价值指
标
名称
定义
EBITG
息税前收益
增长率
本期滚动 12 个月息税前利润/上期滚动
12 月息税前利润-1
NPG
净利润增长
率
本期滚动 12 个月净利润/上期滚动 12 月
净利润-1
MPG
主营利润增
长率
本期滚动 12 个月主营业务利润/上期滚动
12 月主营业务利润-1
GPG
毛利润增长
率
本期滚动 12 个月销售毛利润/上期滚动
12 月销售毛利润-1
OPG
营业利润增
长率
本期滚动 12 个月营业利润/上期滚动 12
月营业利润-1
OCG
经营现金流
增长率
本期滚动 12 个月经营性现金流净额/上期
滚动 12 月经营性现金流净额-1
量化成长模型选择高成长性的股票构建组合,在前面的研究报告《量
化投资系列之成长模型——ROIC-NPG:
挖掘成长伏藏》中,我们以
ROIC-NPG 两个指标来 构建成长模型。
根据我们对各项指标的重新梳
理,现将 ROIC 列为质量指标,另外构建了包括 EBITG(息税前收益
增长率)、NPG(净利润增长率)、MPG(主营利润增长率)、
GPG(毛利润增长率)、OPG(营业利润增长率)、OCG(经营现金
流增长率)、NAG(净资产增长率)、EPSG(每股收益增长率)、
ROEG(净资产收益率增长率)、GMPG(毛利率增长率)等十个考核
公司成长能力的指标。
根据 2002 年 1 月~2009 年 11 月,接近八年的
时间共计 95 期数据的更新测试。
结果表明,以 EBITG-NPG-MPG-
GPG-OPG-OCG 六个指标进 行联合打分选股,所得到的成长组合表现
最优。
表 3:
成长指标及其定义
分别以指标排名的前 20%、10%和 50 只股票构建成长组合,其在
2002.1~2009.11 的测试期内,相对沪深 300 指数的超额 收益均可通过
90%置信度下的统计检验,其中 10%组合的统计置信度达到 97%,50
价值指
标
名称
定义
ROA
总资产收益
率
滚动 12 个月净利润×2/(期初+期末总资产)
ROC
资本报酬率
滚动 12 个月净利润/(股东权益+长期负
债)
GPM
销售毛利率
滚动 12 个月销售利润/滚动 12 个月销售收
入
CTAR
现金总资产
比率
滚动 12 个月经营现金流净额×2/(期初+期
末总资产)
CNAR
现金净利润
比率
滚动 12 个月经营现金流净额/滚动 12 个月
净利
TAT
总资产周转
率
滚动 12 个月营业总收入×2/(期初+期末总
资产)
只组合的统计检验置信度达到 99%。
1.4、 质量模型——甄选优质蓝筹
量化质量模型选择资质优异的公司股票构建组合。
我们从 六 个方面的
财务指标来考察公司的资质,包括偿债能力、经营能力、营运能力、现
金流质量、盈利能力、分红能力等。
采用 ROA(总资产收益率)、
ROE(净资产收益率)、ROC(资本报酬率)、OPM(营业利润率)、
GPM(销售毛利率)、现金流指标、COIR(现金营业收入比率)、
CTAR(现金总资产比率)、CNPR(现金净利润比率)、TAT(总资产
周转率)、LAT(流动资产周转率)等十个指标来进行股票的筛选。
根
据 2002 年 1 月~2009 年 11 月,接近八年的时间阶段,共计 95 期数
据的测试。
结果表明,以 ROA-ROC-GPM-CRAR-CNPR-TAT 六个指标
进行联合打分选股,所得到的质量组合表现最 优。
表 5:
质量指标及其定义
分别以指标排名的前 20%、10%和 50 只股票构建质量组合,其在
2002.1~2009.11 的测试期内,相对沪深 300 指数的超额 收益均可通过
95%置信度下的统计检验,其中,10%和 50 只组合获得超额收益的概
率更高,通过统计检验的置信度 都在 99%左右。
2. 五个衍生模型
2.1、四个叠加模型
通过对股票的价值、成长和质量三个属性因子的指标进行 分类排序打
分,我们分别得到价值模型、成长模型和质量模型三个基本选股模型,
利用这些模型,我们可以筛选出低估值的股票组合、高成长的股票组合
以及资质优 秀的股票组合,从历史统计检验结果来看,这些量化组合
都能显著战胜基准指数。
但是,三个基本模型只侧重股票某一方面的属性,而通过将 三种属性
进行叠加,就可以得到 同时具备几个属性优势的股票组合,例如,选
择价值属性和成长属性同时优秀的股票构建组合,就可以得到价值成长
模型 1。
通过对股票各种属性因子进行联合打分选股,可以得到四个叠
加模型,分别为价值成长模型(VG)、价值质量模型(VQ)、成长质
量模型(GQ)和价值成长质量模型(VGQ)。
根据前面三个基本选股模型的研究结果,这里采用 PE-PB-PCF 作为股
票价值属性因子的度量指标;以 EBITG-NPG-MPG-GPG-OPG 作为股票
成长属性因子的度量指标;以 ROA-ROC-GPM-CRAR-CNPR-TAT 作为
股票质量属性因子的度量指标。
并以此来构建四个叠加 模型。
叠 加模型的选股流程与基本模型类似,只是在第二步构建股票组合中,
首先需要对待选股票的各个指标进行排序打分,然后将同一属性因子的
指标得分进行相加,即可 得到属性因子得分,再将各个属性因子得分
进行加权求和,就可得到最终的量化分值,最后选择量化分值最小的股
票即可构建相应的叠加组合。
在组合调整时也进行 同样的操作。
图 12 给出了不同规模股票组合残余可分散风险占比,从中可以看出,
随着组合规模的不断增大,残余可分散风险占比逐渐下降,同时可分散
风险占比的下降速度也逐渐减 小。
二、量化组合及特征分析
1.股票个数选择
股票组合的市场风险由系统性风险和非系统性风险组成, 其中系统性
风险不可分散,而非系统性风险可以通过增加股票个数来减少,即实现
风险分散化。
但是,股票组合的持股数量并不是越大越好。
一方面,当
组合股票数 目增加至一定程度,对非系统性风险的边际降低程度会递
减,而随之带来较高的交易费用及管理成本问题却已开始蚕食组合收益
率;另一方面数目众多的证券组合中 可能包含一些无法及时得到相关
信息且收益较低的证券,从而增加了及时有效进行投资组合调整的难度。
因此需要在分散风险和提高收益之间寻找一个平衡点。
我们采用 Evans and Archer 的方法对组合的分散化程度进行度量。
具体
方法如下:
当组合规模数达到 38 只时,沪深 300 样本组合的残余可分散风险下降到了
1%以内;当组合规模数达到 41 只时,中小板样本以及基金持股样本的残余可分散
风险占比下降到了 1%以内;当组合规模达到 45 只时,全市场样本的残余可分散
风险占比也下降到 1%以内。
由于我们量化组合的股票是从全市场样本中选择的,因此为分散组合风险,
需要将股票个数控制 在 45 个以上。
而从实际的选股模型对组合股票个数的敏感
性分析来看,当股票个数大于 40 个、小于 60 个时,组合历史测试的业绩表现相
对出色和稳定。
以价值模型为例(见表 9),当股票个数较少时,组合的月均收益
最好,但波动较大,随着股票个数增加到 40 个以上时,组合的表现趋于稳定,而
当股票个数大于 60 个后,组合又开始变差。
此 外,从国内公募基金的持股情况来看,其公布的平均持股数量在 60 只左
右,而实际的重仓股一般控制在 50 个以内。
综上所述,我们认为,以 50 只股票来构建量化组合是合适的,既能有效分
散风险,最大获得收益,又能满足基金等机构投资者的建仓和持股需要。
2.十个量化组合
前面,我 们以自下而上的选股方式,构建了三个基本选股模型和五个衍生选
股模型,其指标和参数是通过近 8 年的历史数据测试分析得出,但是这些指标并
非一成不变,今后,我们每年将对这些选股模型进行定期更新测试,并相应调整
选股指标及相关参数。
根据三个基本模型和四个叠加模型,我们以 50 只股票分别构建出价值组合
(V50)、成长组合(G50)、质量组合(Q50)、价值成长组合(VG50)、价值质
量组合(VQ50)、成长质量组合 (GQ50)和价值成长质量组合(VGQ50)。
根据交叉深度为 8%和 18%的 GARP 模型,我们分别构建了积极 GARP 组合
(aGARP)和稳健 GARP 组合(sGARP),这两个组合的股票个数不是固定的,其中,
aGARP 组合统计期间最大持股数为 20 只,最少为 2 只,平均持股 9 只。
sGARP
组合统计期间的最大持股数为 55 只,最少为 23 只,平均持股 37 只。
此外, 考虑到一些中小投资资金的需求,我们利用 VGQ 模型构建了一个只
含有十只股票的 VGQ10 组合。
从历史统计检验上看(见表 11),VGQ10 组合相对
沪深 300 指数的超额收益可以通过 99%置信度下的 t 检验,而且从风险收益上看
也表现卓越。
3.组合特征分析
上述十个 量化组合分别来自于八个选股模型,虽然从历史统计检验的角度来
看,各个组合都是有效和可靠的,但由于各个模型本身的侧重点和选股方式不一
样,也使得的量化 组合会产生不同的特点,有着不同的收益预期,适合不同的投
资者。
下面,我们从风险收益特征、组合相关性和市场容量等几个方面对十个组
合进行比较分析。
风险收益特征
从 2002 年 1 月到 2009 年 11 月近 8 年的历史月度收益数据来看,十个量
化组合相对沪深 300 指数均取得了显著的超额收益(见表 12)。
其中,股票个数
较少的 aGARP 组合和 VGQ10 组合相对沪深 300 指数的月度超额收益都超过了
2%,它们也同时获得了最高的累计收益,分别达到 1794%和 1485%,远远高于同期
沪深 300 指数 161%的累计涨幅,但同时,两个组合收益的波动性也最大,其年化
标准差分别达到 41.5%和 43.3%。
从 Beta 系数上看,两个少数股票组合 aGARP 和 VGQ10 最大,都超过 1.1,
而 Q50 和 GQ50 两个组合的 Beta 值小于 1,其余组合的 Beta 值都介于 0.9 和 1
之间。
从最大涨跌幅度来看,无论是按单月还是半年计算,Q50 和 GQ50 组合都是
相对较小的,这与他们的 Beta 系数较小有关。
而 V50 表现相对出色,牛市能涨,
熊市抗跌。
从战胜沪深 300 指数频率来看,aGARP 组合表现最好,接近 70%,其次是
V50 组合,达到 68.4%,此外,VG50、VQ50 和 VGQ50 组合也都接近 2/3,只有
G50 组合最差,不到 60%。
如果将组合的投资时间增加,则战胜基准的频率将显著
提高(见表 13)。
从历史测试结果来看,滚动投资组合 1 年时,十个量化组合均
可在 90%以上的概率战胜沪深 300 指数,其中持有 aGARP 组合战胜指数的概率达
到 100%。
如果以会计年度计算组合收益(见表 14),在测试的 8 年(2009 年为前 11
个月数据)时间里,除了 G50 组合在 2003 年和 V50、VG50、VGQ50 及 sGARP 组
合在 2006 年跑输指数以外,其余年份里各个组合均获得沪深 300 指数的超额收
益,尤其是 Q50、GQ50、aGARP 和 VGQ10 四个组合连续八年战胜沪深 300 指数。
从不同市场行情表现来看(见表 15),十 个组合均可获得相对沪深 300 指
数的超额收益。
其中,G50 和 VQ50 组合在牛市行情下的超额收益要明显大于熊市,
显示出很强的进攻特性;而 Q50 和 GQ50 组合在熊市里的超额收益大于牛市,表
现出较好的防御特性;V50、VG50、VGQ50 和 sGARP 四个组合在牛市和熊市里的超
额收益差别不大,但都好于调整行情。
aGARP 和 VGQ10 两个组合在三种市场行情
下的超额收益都非常大,不过相对来说牛市行情仍然更为出色。
利 用沪深 300 指数的历史月度收益率数据将市场分为上升市场和下降市场,
来看不同市场环境下各个量化组合的风险收益特征(见表 16)。
在上升市场中,除 V50 外,其余组合的 Alpha 均大于 1%,其中 GQ50 组合的
Alpha 接近 2%。
从 Beta 角度来看,V50、sGARP 以及 VGQ50 的 Beta 系数较大,
而 G50、Q50 以及 GQ50 的 Beta 系数均小于 1。
由于 Beta 系数较小,上升市场中
Q50 和 G50 战胜沪深 300 的频率都较低,不到 60%,而 V50、VG50 以及 sGARP 战
胜市场的频率到超过 70%。
在下降市场中,sGARP 和 GQ50 的 Alpha 均超过 2%,V50 的 Alpha 较小,不
到 0.3%。
从 Beta 角度来看,V50、aGARP、Q50 以及 VGQ50 的 Beta 系数都小于 1,由
于 Beta 系数较小,除 aGARP 外其余 3 个组合在下降市场中战胜沪深 300 的频率
都较高。
而 CQ50 由于 Alpha 较大而 Beta 较小,在下降市场中战胜沪深 300 的
频率最高,达到 72.97%。
将量化组合的 Beta 和 Alpha 表示在一个图中(见图 13、14),我们可以明
显看到,下降市场中 Q50 组合表现最好,它的 Alpha 较大,但 Beta 较小,这样
即可有效对抗市场下跌风险,又能获得稳定超额收益。
而在上升市场中,应该优
先选择 aGARP、VGQ10、sGARP 等组合,他们不但 Beta 大,而且 Alpha 收益也高,
这样可以在市场上升趋势中更大幅度的超越指数。
组合相关性分析
从绝对收益 角度看,由于 A 股市场系统性风险较大,各个量化组合也表现
出与市场齐涨齐跌的现象,10 个量化组合只有 VGQ10 与沪深 300 指数月收益率
的相关系数低于 0.9(见表 17)。
量化组合绝对收益率之间的相关性也较大,除 V50
与 GQ50 以及 V50 与 VGQ10 之间相关系数为 0.88 和 0.89 外,其余组合间相关系
数均大于 0.9。
由于 十个量化组合分别代表不同的风格,所以从相对沪深 300 指数的超额
收益角度来看,不同组合间的相关性要远小于绝对收益间的相关性(见表 18)。
其中 V50 与 GQ50 超额收益间相关性最小,相关系数仅为 0.19。
组合市场容量
由于量化组合对选中的股票进行等权重配置,若组合中包含的某些股票流动
性较差,在实际的投资中可 能会对组合的构建造成一定的影响。
为此,我们根据
木桶原理,以组合中流动性最差的股票所能建仓的资金量来测算组合的市场容量。
对于每一个量化组合,假设组合中流动性最差的股票在构建组合当日所有成
交量全部被买入,则将其成交 金额数乘以组合股票个数即是组合所能容纳的资金
量。
实际中,买入某一股票某天的全部成交量不太现实,投资时可以选择流动性
好的股票当天成交,部分流动性较 差的股票分几天建仓来实现。
假设组合中所有
股票均分 5 天建仓,则建仓期的延长可能对组合的建仓成本造成影响。
经过我们
测算,如果组合中所有股票均分 5 天平均建仓,则建仓期的延长对组合月平均收
益的影响大约在 20 个 BP 左右(见图 15)。
用最近 6 个月组合容量的平均值表示当前量化组合的市场资金容量,则
V50、Q50、VG50、VQ50、GQ50 的资金容量均在 7 亿以上,G60 和 VGQ50 的资金
容量在 6 亿以上,sGARP 的资金容量在 4 到 5 亿间,aGARP 和 VGQ10 由于包含
股票较少,市场容量均在 2 到 3 亿间。
组合特征比较
参考各个组合的历史表现,我们分别以测试期间的月均收益、标准差、战胜
指数频率来衡量组合的预期收益、波动性和稳定性,以组合历史上不同市场 行情
下的表现来考核组合所适合的市场行情,并以组合市场容量来表示其所能容纳的
投资资金(见表 19)。
从比较结果来看,各个组合各有所长,投资者可根据自 身
情况和市场预期进行选择。
三、总结与组合推荐
总结
我们以自下而上的选股 方式,分别构建了八个量化选股模型,通过不同的参
数选择,构建出十个量化组合。
1) 从历史统计检验结果来看,各个量化选股模型都是显著有效的。
量化选
股的主要目标是战胜比较基准,即沪深 300 指数,而通过对各个选股模型采用近
八年的历史数据进行实证检验,结果表明这些选股方式是有效和可行的,尤其是
以 50 只或较少的股票构建组合时,其相对沪深 300 指数的超额收益都能通过 99%
置信度下的统计检验。
2)从历史模拟测试效果来看,量化组合的表现是稳定和出色的。
在接近八年
的历史模拟测试中,根据八 大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 量化 投资 模型 系列 GARP