查看原文
其他

指数分析系列:300价值与300成长(一)

DM 慢慢来刚刚好 2023-02-17
一、沪深300样本空间及变化
1、指数样本空间
由同时满足以下条件的非 ST、*ST 沪深 A 股和红 筹企业发行的存托凭证组成: 
  • 科创板证券、创业板证券:上市时间超过一年。
  • 其他证券:上市时间超过一个季度,除非该证券自上市以 来日均总市值排在前 30 位。
2、样本空间近期变化
2021年,创业板纳入沪深300样本空间的年限从上市超过3年缩短为1年,2021年12月13日实施。往前推,创业板是2014年9月11日发布公告,上市满三年的证券纳入沪深300样本空间;科创板是2020年11月27日公告,2020年12月14日正式实施,上市满一年的证券纳入沪深300样本空间。

3、创业板&科创板纳入成分股情况

创业板2009年10月30日正式上市,2014年9月11日公告纳入沪深300样本空间,随后在12月15日首次纳入创业板成分股,首年一次性纳入10只,随后每年3-5只的规模。到2021年年底,由于规则变化,创业版从上市满3年改为1年,数量一年内到14只,2022年纳入11只,每年也有剔除,目前有36只的存量。

科创板于2020年底正式纳入沪深300样本空间,2020年12月纳入4只,2021年8只,2022年4只,同时剔除1只,净额15只。

沪深300中,创业板和科创板代表了成长股纳入,数量从2021年大幅增加,到2022年共51只,数量占比从此前的5~6%提高到2022年的17%。


二、300风格指数编制规则

沪深 300 风格指数从沪深 300 指数样本中,根据成长因子和价值因子计算风格评分,分别选取成长得分与价值得分最高的 100 只证券作为成长指数样本与价值指数样本。

1、选样方法
(1) 对样本空间内证券,计算其成长因子与价值因子的指标值。
成长因子包含三个指标:主营业务收入增长率、净利润增长率和内部增长率;
价值因子包含四个指标:股息收益率、每股净资产与价格比率、每股净现金流与价格比率和每股收益与价格比率。


【成长指标】
  • 主营业务收入增长率(SALESG):
    采用过去 3 年主营业务收入与时间(第 1 年、第 2 年和第 3 年分别取值 0、12 和 24)进行回归分析,计算回归系数与过去 3 年主营业务收入平均值的比值
    注:具体公式在另一份文件《上证全指风格系列指数编制方案》中有描述,如下。
    红框处表述有误,不是增长率的平均值,应是主营业务和净利润的平均值。
    看上去逻辑像是回归系数和调和平均:
    回归方程:y=a*t+b
    t=0, y=b;
    t=1, y=a+b, 增长率=(a+b-b)/b=a/b;
    t=2, y=2a+b, 增长率=a/(a+b);
    t=3, y=3a+b, 增长率=a/(2a+b);
    三段增长率的平均,采用调和平均数计算:
    即营业收入增长率=回归系数/过去3年主营业务收入。不过,按理说这种平均增长率应该是用几何平均数,不深究,知道这是主营业务收入增长率指标即可。
    举例茅台,最近三年营业收入854.3亿、949.2亿、1061.9亿,取0,12,24进行一元回归,excel可实现,方法一是散点图添加趋势线显示方程,方法二用excel的“数据分析”功能计算,如下对应两个图表即两种方式。
    SALESG=8.65/((854.3+949.2+1061.9)/3)=0.91%;
    时间采用0,12,24,结果对应的是月度。
    这里有个疑问,三组数字就做回归分析取值,指标可靠性是存疑的,瞎想,有一部分股票风格飘逸。翻了下样本调整历史,历次调整都用满了20%,100只成分股,每次替换掉20只,可能有沪深300样本调整的原因,也有这个指标本身的原因,毕竟这个数值占成长值30%权重
  • 净利润增长率(PROFITG):
    采用过去 3 年净利润与时间(第 1 年、第 2 年和第 3 年分别取值 0、12 和 24)进行回归分析,计算回归系数与过去 3 年净利润平均值的比值;
    PROFITG和SALESG计算方式和上面一样,也和上面同样的疑问,部分股票风格飘逸,这两各占30%权重。
  • 内部增长率(G):净资产收益率×(1-红利支付率);
    注:1-红利支付率,即利润留存率,净资产收益率(ROE)=净利润/净资产,这里考察利润留存再投的收益,留存率高,可理解为企业把钱留下来继续投资而不是分掉,考察的是公司只依靠自身造血能力实现的增长率。
【价值指标】
  • 股息收益率(D/P):过去 1 年现金红利与过去 1 年日均总市值的比值;
    注:一般股息率高,偏价值型,成长股偏向于不分红。
  • 每股净资产与价格比率(B/P):最新净资产与过去 1 年日均总市值的比值;
    注:1/PB,PB的倒数,PB为净资产倍数,成长型PB偏高(1/PB偏低),价值型PB偏低(1/PB偏高);
  • 每股净现金流与价格比率(CF/P):过去 1 年净现金流量与过去 1 年日均总市值的比值;
    注:净利润是账面数字,有净利润 ≠ 有现金,这里考察是否真有钱,是否入不敷出。净现金流=经营活动现金流净额+投资活动现金流净额+筹资活动现金流净额。
  • 每股收益与价格比率(E/P):过去 1 年净利润与过去 1 年日均总市值的比 值;
    注:PE倒数,可理解为期望收益率。成长型股票一般PE偏高,价值型偏低,如PE=10和PE=50,对应期望收益率为10%和2%。很多投资者针对成长型股票不是看PE,彼得林奇看PEG,有的看PS。

(2) 对上述待选样本中,计算其成长评分与价值评分。
成长评分为三个成长指标 Z 值的平均值,价值评分为四个价值指标 Z 值的平均值。各指标 Z 值采用极值调整后的值进行计算,计算公式为:

注:Z值及标准化过程,使得三个指标在同一个维度。

极值的处理:对样本空间所有证券的指标值由低到高排名,对于处在前 5% 或者后 5%区间的指标值,分别设定为 5%分位点或 95%分位点的数值

(3) 在上述待选样本中,按照成长评分与价值评分确定指数样本:

  • 选取成长评分最高的 100 只证券作为沪深 300 成长指数的样本;

  • 选取价值评分最高的 100 只证券作为沪深 300 价值指数的样本;

注:举个例子,沪深300有300只股票,分别计算300只成分股的三个成长指标和四个价值指标。每只成分股都需要计算6个Z值。单个成分股的6个Z值计算完毕后,取三个成长指标的Z值的均值作为成长评分,取四个价值指标的Z值均值作为价值评分,300个成分股,每只都有一个成长评分和价值评分,然后排序,分别取头100只。

这个选股过程,会出现部分成分股既在300成长,又在300价值,不是非此即彼,比如当前两只指数共有样本有15只:


2、指数计算

自由流通市值加权,权重因子介于0~1之间,使单个样本权重不超过10%。样本每半年调整一次,调整比例不超过20%。
限制权重上限的市值加权指数。


三、指数特点

1、指数表现

大体上可以分为几段:

用300成长、300价值点位相对沪深300的偏离幅度,看二者风格(看到有直接用比值,这里用差异幅度)

2009Q2~2015Q1:300成长好于沪深300,最高差异近10%,300价值弱于沪深300,最大差异超过-10%;

2015Q1~2019Q4:300成长和300价值都好于沪深300,即按成长选出来的100只和按价值选出来的100只分别都要好于另外200只风格中庸的股票。价值与沪深300的最大差异超过30%,且300价值好于300成长;

2019Q4~至今:300成长与价值分化,300成长继续走强,到2021Q2与沪深300差异接近40%,同期300价值回落并与沪深300保持相对一致。目前,300成长正在回归沪深300,但仍有超过20%的差异。

总体上,以2008年为起点,300成长持续跑赢沪深300的时间更多,而300价值与沪深300比较则呈现相对的周期特征。2017年后,二者的波动都比之前更大。

注:数据选取时间段不同,结论可能会有差异。更理想的比较方式,采用之前使用过任意时点买入持有N年进行比较看收益分布。

2、沪深300样本空间变化对300成长影响

前文介绍了沪深300样本空间的变化,明显影响是在2020的科创板纳入和2021年的创业板从3年改为1年,使得创业板+科创板的样本占比从以前的6%左右突升到到15%~17%,创业板+科创板是以成长股为主,这可能是导致300成长明显更大波动的原因,2020到2022,涨幅大跌幅也大。

注:按照指数规则,纳入沪深300的创业板和科创板股票不一定100%在300成长中)。

我倾向于认为300成长最近这三年明显跑赢沪深300和300价值以及近期更大幅度的下跌,更多的是样本空间的变化带来,这种变化在2014年创业板一次性纳入10只时没有类似表现,彼时是市场同涨同跌一致性较高,现在是分化的市场,成长股较大数量的纳入,权重明显增加,对指数风格的影响也更大。

中金量化做了一张图,沪深300的行业分布在过去的10多年里出现了显著变化,最明显的是银行的权重占比从20%的高位下滑至近期的10%-11%,权重几乎减半;非银权重也由17-18年时期的18%的高峰降至近期的7%,即金融在沪深300中的权重由原来的38%大幅萎缩,中证官网最新的数据是19.76%(和中金使用的行业分类可能不一致,不影响结论)。

与之相对应的是电力设备与新能源行业权重在2020年以后快速上升,由2020年初的2%快速上升至近期的13%,一跃成为沪深300指数成份的第一大权重行业。同时,电子和医药行业的权重也在最近5年中保持稳定的上升趋势。

如果沪深300样本空间后面没有类似调整,预计300成长后面出现超过2020~2022年偏离沪深300这种波动幅度的可能性也会减小,这种突变的波动更多的是规则变化导致。

是否会持续跑赢沪深300,无法判断。中金在《中金 | 宽基指数增强2.0体系》分析中有个结论,与中证500和中证1000比,沪深300指数成分股的风格一致性相对较弱,沪深300指数在成长和价值风格因子的暴露度的波动明显高于中证500和中证1000。以离散度作为度量指数风格一致性的反面指标,离散度越大则表明指数的风格稳定性越弱,风格漂移的情况越容易发生,也进一步导致因子和模型的失效可能性上升。

不懂因子分析及风格暴露度如何计算,太烧脑,单纯从直观感觉上认为,很难判断300成长和价值的长期趋势及周期特征。但可以肯定的是,相比过去,沪深300在向成长方向变化。

3、估值变化及分布特征

沪深300市值加权PE最近十年来(2012年以来)呈现水平略微上升的趋势,原因上面提过了,成长型股票逐渐纳入,300成长则呈现明显上升,300价值略微向下。2012~2017年中,300成长的PE和沪深300不相上下,说明另外200只的PE综合了成长部分,2017年中以后,300成长的PE与沪深300和300价值明显拉开距离。

分布上看,300成长市值加权PE分布很广,且没有特别集中的趋势,相对分散,300价值的PE则分布较窄,且8-9是集中区域;沪深300介于二者之间,也有相对集中的趋势,12上下是集中区域。

这种特性可以理解为,最近十来年沪深300和300价值都有较为明显的均值回归特征,但300成长则不明显,也就是说,以PE百分位为参考来做300成长的交易,效果可能不太理想,如果参考,是不是考虑用PEG(待研究)?

待续(也可能没了,暂时倾向于不作为选择标的)......

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存