直观理解 GRS 和 MV Spanning

Original 石川川总写量化 2022-05-14

收录于合集

#实证资产定价 66 个

#计量经济学 13 个

作者：石川，北京量信投资管理有限公司创始合伙人，清华大学学士、硕士，麻省理工学院博士。

封面来源：https://www.pexels.com

未经授权，严禁转载。

摘

要

GRS 和 Mean-Variance Spanning 是常见的多因子模型检验手段。本文介绍它们的直观含义。

引言

所有的多因子模型都“不完美”—— 只要我们拿足够多的 test assets 去“折磨”它，任何模型都会被拒绝。然而有些模型是“有用”的。

如果一个模型中的因子都有可靠的经济学或金融学依据、代表了某种系统性风险或错误定价的原因，且该多因子模型能够解释大量所谓的异象的话，那么这样一个模型就是有用的。然而从不同的逻辑出发，人们总能提出不同的因子，并用它们组合出不同的多因子模型。如何评判哪个模型更好呢？

Barillas and Shanken (2017) 指出，评价一个多因子模型既要看它能否解释 test assets 又要看它能否解释其他模型的因子。这意味着我们往往用一篮子资产去检验一个多因子模型。怎么检验呢？通常来说可以有两个切入点。

第一个切入点是联合检验 N 个定价误差是否为零；与之相反的，第二个切入点则是单独考察每个资产的定价误差是否为零。无论是哪种切入点，在学术界的实证资产定价中都十分常见。对于前者，最常使用的方法当属 GRS 检验和 Mean-Variance Spanning（均值-方差张成）检验。解释这两种检验的直观含义就是本文的目标。

在接下来的文章中，假设待检验的多因子模型包含 K 个因子，用于检验模型的 test assets 有 N 个。

GRS 检验

GRS 检验由 Gibbons, Ross, Shanken (1989) 提出，并由此得名。关于它的检验统计量，前文《股票多因子模型的回归检验》的时序回归已经做过介绍，本文不再赘述。此外，[因子动物园] 的《检验因子模型：Alpha, GRS 与 GMM》一文也有过说明，感兴趣的小伙伴请参考。

GRS 检验有两个优点。首先，它的 F-统计量是有限样本（finite sample）下的统计量，即 GRS 检验给出了给定样本大小 T 下这些定价误差应满足的联合分布，该检验是高度精确的。当样本量趋于无穷的时候，定价误差的联合分布渐进趋于 χ2 分布，但在有限样本下使用 χ2 分布并不可靠，这就凸显了 GRS 检验的价值。此外，GRS 检验有非常高的检验效力。当然，任何事物都有两面。GRS 统计量的精确性高度依赖正态分布假设，即资产收益率的残差服从联合正态分布。在现实中，该假设可能过于严格而无法满足，这会降低 GRS 检验在实践中的可信度。

GRS 检验被学术界广泛使用。比如 Liu, Stambaugh, and Yuan (2019) 就用 GRS 检验比较了他们提出的中国版三因子模型和按照 Fama and French (1993) 一文构建的三因子模型。通过这两个多因子模型之间的因子相互 PK，Liu, Stambaugh, and Yuan (2019) 发现他们的因子优于Fama and French (1993) 中的因子。

借助计算机的运算能力，我们如今可以很容易的计算出 GRS 统计量并进行检验。但是计算归计算，我们更希望搞清楚 GRS 检验背后的本质。好消息是，GRS 统计量还有另一种形式：

上式中，\hat θ_{N+K} 表示由全部 N 个 test assets 和 K 个因子构成的事后（ex post）最大夏普率投资组合的夏普率；\hat θ_K 表示由 K 个因子构成的事后最大夏普率投资组合的夏普率。GRS 统计量可以直观的理解为当 K 个因子之外加入 N 个 test assets 之后，能够获得的最大夏普率是否显著高于仅由 K 个因子实现的最大夏普率。如果夏普率显著提高，那么该因子模型就不能解释这 N 个 test assets。

Mean-Variance Spanning 检验

Huberman and Kandel (1987) 提出的 Mean-Variance Spanning（以下简称 MV Spanning）检验是另一种常见的联合检验手段。从名字就不难看出来，该方法和现代投资组合理论（Modern Portfolio Theory，下称 MPT）以及均值-方差分析有着紧密的联系。

这种方法的核心无疑是 spanning 一词。假如市场中有 K 个因子投资组合；通过按各种不同的权重配置它们又能得到许多新的组合。对于每个给定的预期收益率 \hat μ，都能找到它的最小方差投资组合。将不同 \hat μ的最小方差投资组合都绘制在横坐标为标准差、纵坐标为预期收益的二维平面内，就得到了人们熟悉的最小方差前沿（minimum-variance frontier），它的形状是一个抛物线。

图中的最小方差前沿就是由这 K 个因子 spanned 出来的，这就是这种方法得名的原因。而 MV Spanning 检验所关注的问题用一句话概括那就是：加入 N 个 test assets 后，全部 N + K 个资产张成的新的最小方差前沿能否显著“优于”仅由 K 个因子张成的最小方差前沿。“优于”意味着对于每一个给定的预期收益率，N + K 个资产张成的前沿上的点都比 K 个因子张成的前沿上的点有更低的方差。

下面来看看数学上这种检验的原假设是什么。令 R_{1t} 和 R_{2t} 分别为 K 个因子和 N 个test assets 的收益率向量。由多因子模型可知：

接下来，定义 δ = 1_N – β1_K（下标 N 和 K 代表向量中元素个数）。Huberman and Kandel (1987) 给出了 MV Spanning 检验的原假设的充要条件：

当原假设成立时，对于任何一个 test asset（或这些 assets 的线性组合），我们总能使用 K 个因子来构建一个投资组合，并使得该投资组合的预期收益率和 test assets 的预期收益率相同，但方差更低。这两条关于预期收益率和方差的性质说明，这 N 个 test assets 无法在 K 的基础上张成更优的最小方差前沿，因此可以接受原假设。

除了上述数学含义外，从由全部 N + K 个资产张成的最小方差前沿上也能够找到上述原假设的直观解释。Kan and Zhou (2012) 指出，在这个最小方差前沿上存在两个特殊的投资组合。其一是全局最小方差组合（global minimum-variance portfolio），其二是从均值-标准差二维平面的原点向最小方差前沿做切线的切点。

如果原假设成立，条件 α = 0 则意味着全局最小方差投资组合中，N 个 test assets 的权重都是零，即该组合完全由 K 个因子构成；条件 δ = 0 意味着切点投资组合中也没有 N 个 test assets 的身影。换句话说，这两个特殊的投资组合均仅仅由 K 个因子构成。

在投资组合理论中，有一个重要的定理是 two-fund separation theorem。它的含义是，使用最小方差前沿上的任意两个组合就能构造出整个前沿，即前沿上的其他组合都可以由这两个投资组合的某种线性组合得到。利用 two-fund separation theorem，可以推断出如果这两个投资组合中均不包含 N 个 test assets，那么整个由 N + K 个资产构成的最小方差前沿上的所有投资组合都不包含它们，这就解释了为什么 α = 0 和 δ = 0 是原假设成立的充要条件。

虽然我们已经从直观上理解了 MV Spanning 检验要干什么以及它的原假设是什么，但为了进行检验，还是要用到具体的统计检验量。在这方面，Huberman and Kandel (1987) 一文最早提出了似然比（likelihood ratio）检验统计量；Kan and Zhou (2012) 在它的基础上又通过 Wald 检验和拉格朗日乘数（Lagrange multiplier）检验构建了两个检验统计量。这三个检验统计量在大样本下都渐进满足自由度为 2N 的 χ2 分布。

这三个统计量的表达式十分接近，且均和两个重要参数 λ_1 和 λ_2 有关。关于这两个参数，Kan and Zhou (2012) 给出了一个非常直观的经济学解释。为了介绍它，首先需要一些铺垫。考虑下图所示的均值-方差平面中由 K 个因子张成的最小方差前沿。在纵轴上取 (0,r) 点并从它向最小方差前沿做切线、找到切点组合 (\hat μ_{tp}, \hat σ_{tp})。

接下来，定义：

它表示图中切线的斜率。由于不同的 (0,r) 点会产生不同的切线，因此 \hat θ_K(r) 是 r 的函数。当 r 等于真正的无风险利率 R_f 时，\hat θ_K(R_f) 就是从 (0,R_f) 出发得到的切点组合的夏普率。类似的，当把 N 个 test assets 加入后，我们可以定义 \hat θ_{N+K}(r)。有了这两个 \hat θ 就可以写出 λ_1 和 λ_2 的表达式了：

最后，通过 λ_1 和 λ_2 就可以方便的求出似然比检验、Wald 检验以及拉格朗日乘数检验的统计量（分别记为 LR、W 和 LM）：

这三个统计量虽然略有差异，但它们都是以某种形式将 λ_1 和 λ_2 凑在一起作为一个综合的分数来检验原假设。由 λ_1 和 λ_2 的定义可知，我们实际上在纵轴上搜寻两个特殊的 r：对于第一个 r，由 K 和 N + K 个资产张成的最小方差前沿上的相应的两个切点的 \hat θ 值差异最大；对于第二个 r，这两个最小方差前沿上的相应的两个切点的 \hat θ 值差异最小。这三种统计量以这两个特殊 r 下两个前沿的综合差异来检验这两个前沿是否在统计上有所不同。

以上就是大样本下三种 MV Spanning 检验的统计量。有必要说明的是，当样本量 T 较总资产数 N + K 不足够大时，使用这些统计量并不准确，更好的方法是像 GRS 检验一样计算有限样本下的统计量。悲催的是，从数学上推导有限样本下统计量的表达式十分繁琐。不悲催的是，Kan and Zhou (2012) 给出了这些统计量的几何含义，理解起来就一个字 —— 爽！本文第 4 节将会介绍。

关于 MV Spanning 检验的应用，一个很有代表性的例子是 Han, Zhou, and Zhu (2016)（见《美股上一个跨越时间尺度的趋势因子》）。三位作者针对美股提出了一个趋势因子，它不同于传统的动量或反转，而是将不同时间尺度下收益率的动量和反转现象综合到一起，构建了一个综合的趋势因子。该文用新的趋势因子作为 test asset，用传统的短期反转、中期动量以及长期反转因子作为解释变量，通过 MV Spanning 检验进行了分析。结果显示，这三个因子无法解释新的趋势因子，即加入新的趋势因子后，最小方差前沿得到了显著提升。

最后，对比 MV Spanning 中的统计量和 GRS 检验的统计量能够发现这些表达式中都有“神秘的”\hat θ —— 只不过 GRS 检验中的 \hat θ 默认的是用无风险收益率 R_f 计算的夏普率，而 MV Spanning 中的 \hat θ 是使用一般的 r 计算。这意味着它们之间注定有一些关联。

几何含义

无论是 GRS 还是 MV Spanning 都是为了检验 N 个 test assets 能否在原始 K 个因子基础上提高投资组合的风险收益特征。既然是“同一个目标、同一个梦想”，那么它们之间又有什么差异呢？最直观的说明无异于使用几何方法解释它们的含义。让我们从有效前沿（efficient frontier）说起。

根据市场中是否存在无风险收益率 R_f，有效前沿的定义是不同的。下图左侧展示了存在 R_f 的情况、右侧展示了不存在 R_f 的情况。

先看市场中存在无风险利率 R_f 的情况。MPT 指出有效前沿是图中经过点 (0, R_f) 和切点的直线。无论一个人容忍的最大风险是什么，他都应该通过无风险资产和切点组合的某种线性组合实现最优选择，因为这条线的斜率最高，即夏普率最高。

GRS 检验假设市场中存在无风险利率 R_f。回顾一下本文第二节中 GRS 统计量，它关注的核心问题就是加入 N 个 test assets之后，使用全部 N + K 个资产得到的切点组合能否比仅仅使用 K 个因子得到的切点组合有更高的夏普率；除切点组合外，GRS 检验不关心最小方差前沿上的其他点。下图为 GRS 检验的几何意义。

为了方便解释，图中的纵坐标采取了相对 R_f 的超额收益。图中两条切线分别通过原点到由 K 个因子和全部 N + K 个资产张成的最小方差前沿的切点。如果多因子模型无法解释 test assets，那么加入它们之后应该显著提升切点组合的夏普率。在图中横坐标上的 \hat σ = 1 点出发做一条竖直线，它和两条切线相较于 A、B。由夏普率定义可知，A、B 两点纵坐标对应的超额收益恰恰就等于夏普率 \hat θ_K 和 \hat θ_{N+K}，而它们也正是正两条直线的斜率。

由此可知 GRS 统计量中的

和

分别为线段 OA 和 OB 的长度。因此 GRS 统计量的公式反应了这两个线段长度之比，它的意思是检验 OB 的长度是否显著的大于线段 OA 的长度。这正是 GRS 检验的几何意义。

再来说 MV Spanning。上一节介绍了大样本下三种统计量的渐进性质。下面的几何解释则给出了这些统计量在有限样本中的含义。与 GRS 检验不同，MV Spanning 并不假设 R_f 的存在，因此适应更广泛的情况。当 R_f 不存在时，有效前沿是最小方差前沿的上半部分（本小节第一张图的右侧）。

在这种情况下，仍然像 GRS 一样仅仅关注切点组合就不够了 —— 事实上，因为不存在 R_f，因此也没有传统意义上的切点组合。我们希望检验两个事后抛物线是不是在统计上“足够远”—— 原假设是事前没有差别。但既然仅使用一个点来评判不够了，那么怎么办呢？

对了，答案是“找两个点”。

从两个最小方差前沿上找到两个特殊的点进行比较、评判这两个前沿的差异，这就是 MV Spanning 检验的几何含义（下图，出自 Kan and Zhou 2012，就是要通过特殊的点来评价红、蓝两个前沿是不是在统计上足够接近）。而 LR、W 和 LM 三种不同检验统计量之间的差异仅仅因为它们比较这两个前沿的方式稍有区别。

图中 g_1 和 g 分别为由 K 个因子和全部 N + K 个资产张成的事后最小方差投资组合，这两个点代表的投资组合的标准差的大小由图中线段 OD 和 OC 的长度表示。从 g 和 g_1 向纵轴做垂线，得到 A 和 B 两个点。从 A 出发向 K 个因子的最小方差前沿做切线，切线和直线 \hat σ = 1 相交于点 G、同样从 A 出发做 N + K 个资产的最小方差前沿的渐进线，渐进线和直线 \hat σ = 1 相交于点 H。类似的，以点 B 为起点，做 N + K 个资产的最小方差前沿的切线、做 K 个因子的最小方差前沿的渐进线，它们分别与直线 \hat σ = 1 相交于点 E 和 F。使用 OC、OD、AG、AH、BE 和 BF 就可以解释三种检验统计量的几何意义。

先说似然比检验。在有限样本下，其检验统计量满足 F_{2N, 2(T-K-N)} 分布：

LR 的大小和两个比值有关。第一个比值 OD/OC 比较两个全局最小方差组合的标准差。由于 K 个因子构成的最小方差组合的标准差一定不小于 N + K 个资产构成的最小方差组合的标准差，因此 OD/OC ≥ 1。第二个比值是 AH/BF。由于 N + K 个资产张成的事后最小方差前沿一定“优于”仅由 K 个因子张成的事后最小方差前沿，因此 AH/BF ≥ 1。如果原假设成立，即事前（ex ante）两个前沿一样，那么我们可以期待 OD/OC 和 AH/BF 都不会显著的偏离 1。如果它们其中之一或者二者全部显著大于 1，那么原假设就会被拒绝。

对于 Wald 检验和拉格朗日乘数检验，在有限样本下，它们统计量并不满足 F 分布，而是十分复杂的分布，但仍然可以写出它们统计量的几何含义：

怎么样？W 和 LM 的表达式看上去那是“相当对称”。

W 中的第一项是 (OD/OC)^2 - 1，它反映的仍然是两个全局最小方差组合的标准差偏离程度，由于 OD ≥ OC 因此该项中用 (OD/OC)^2 减去 1；再看 LM，它的第一项是 1 - (OC/OD)^2，它和 (OD/OC)^2 - 1 如出一辙，只不过因为分子分母互换了位置导致 (OC/OD)^2 ≤ 1 因此该项中是用 1 减去 (OC/OD)^2。

再看第二项。W 的第二项用到了线段 BE 和 BF，它们都是从 B 出发，BE 是 B 到全部 N + K 个资产的最小方差前沿的切线、BF 是 B 到 K 个因子的最小方差前沿的渐进线。(BE/BF)^2 - 1 衡量了在 K 个因子的基础上加入 N 个 test assets 导致切线斜率平方的提升。反观 LM 的第二项，它用到了线段 AG 和 AH，它们都是从点 A 出发，AG 是 A 到 K 个因子的最小方差前沿的切线、AH 是 A 到 N + K 个资产的最小方差前沿的渐进线。1 - (AG/AH)^2 体现了从 N + K 个资产中去除 N 个 test assets（从而仅剩下 K 个因子）导致切线斜率平方的降低。

不光是表达式，就连解释起来都是那么“对称”。这种“对称”彰显了几何解释之美，彰显了数学之美。

结语

GRS 和 MV Spanning 是实证资产定价中常见的检验方法（尤其是 GRS）。本文花了一些笔墨从直观上解释了它们都在干什么。

总结来说，GRS 假设 R_f 存在，因此它关注的是切点组合的夏普率能否因 N 个 test assets 的加入而显著提升。反观 MV Spanning，它则直接比较两个最小方差前沿的差异。这些统计手段经过了几十年的发展和应用，而如今计算机的运算能力也可以“秒出”检验结果。然而，当我们搞清楚了这些检验统计量的直观含义后，它们便不再只是冰冷的公式，而是一个个令人拍案的“原来如此”。

参考文献

Barillas, F. and J. Shanken (2017). Which alpha? Review of Financial Studies, Vol. 30(4), 1316 – 1338.

Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics, Vol. 33(1), 3 – 56.

Gibbons, M. R., S. Ross, and J. Shanken (1989). A test of efficiency of a given portfolio. Econometrica, Vol. 57(5), 1121 – 1152.

Han, Y., Zhou, G., Y. Zhu (2016). A trend factor: any economic gains from using information over investment horizons? Journal of Financial Economics, Vol. 122(2), 352 – 375.

Huberman, G. and S. Kandel (1987). Mean-variance spanning. Journal of Finance, Vol. 42(4), 873 – 888.

Kan, R. and G. Zhou (2012). Tests of mean-variance spanning. Annals of Economics and Finance, Vol. 13(1), 145 – 193.

Liu, J., R. F. Stambaugh, and Y. Yuan (2019). Size and value in China. Journal of Financial Economics, Vol. 134(1), 48 – 69.

免责声明：文章内容不可视为投资意见。市场有风险，入市需谨慎。

高三女生醉酒后被强奸致死？检方回应

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时

女人最偏爱的十种男人

直观理解 GRS 和 MV Spanning

您可能也对以下帖子感兴趣

高三女生醉酒后被强奸致死？检方回应

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋 华人崩溃大哭 连空姐都吐了; 客机颠簸盘旋3小时

女人最偏爱的十种男人

生成图片，分享到微信朋友圈

直观理解 GRS 和 MV Spanning

您可能也对以下帖子感兴趣

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时