一个加入行为因子的复合模型
作者:石川,北京量信投资管理有限公司创始合伙人,清华大学学士、硕士,麻省理工学院博士;精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:
https://zhuanlan.zhihu.com/mitcshi。
未经授权,严禁转载。
摘
要
Daniel, Hirshleifer, and Sun (2018) 提出了两个行为因子,在市场因子基础上构建了复合三因子模型,为实证资产定价提供了新的思路。
1
引言
2018 年,最新一届的 Hillcrest Behavioral Finance Award 授予了 Daniel, Hirshleifer, and Sun (2018) 这篇题为 Short- and long-horizon behavioral factors 的文章(下称 DHS)。这篇文章从来自 75 个研究机构的 103 为作者所提交的 56 篇文章中脱颖而出,获此殊荣。
从它的题目中就能看出,该文提出了长、短两个时间尺度上的行为因子(behavioral factors)。这两个行为因子旨在捕捉由于过度自信和有限注意力造成的定价错误,从而解释学术界之前发现的大量选股异象。此外,它结合市场因子一起构建了一个复合三因子模型(a three-factor risk-and-behavioral composite model),为多因子模型的研究提供了新的思路。
从行为金融学的角度出发,股票收益率之间的共同运动(comovement)通常有两个原因:
1. 股票错误定价上的共性(Barberis and Shleifer 2003);
2. 投资者对于股票基本面新息的错误反映上的共性(Daniel, Hirshleifer, and Subrahmanyam 2001)。
前者指出不同的股票实际上暴露在一些共同的风格风险上,而情绪冲击(sentiment shocks)会造成同一类风格的股票收益率的共同运动,因此同一类风格上的股票存在相关性很高的定价错误。后者说明由于认知偏差,投资者难以对股票基本面方面的新息做出及时、正确的反映,因此也会导致错误定价。由于错误定价可以预测未来收益率,这意味着可以使用行为因子来构建一个多因子模型,以期更好的解释股票预期收益率之间的截面差异。这就是 Daniel, Hirshleifer, and Sun (2018) 背后的动机。
由于是要提出新的定价模型,它的任务之一是能够解释市场上的异象。按照这个思路,DHS 指出市场上的绝大多数异象按照时间尺度可以分为短(short horizon)和长(long horizon)两大类;短时间尺度的异象大多来自投资者的有限注意力(limited attention)、长时间尺度的异象大多来自投资者的过度自信(overconfidence)。为此三位作者提出了捕捉长尺度异象的 FIN 因子和捕捉短尺度异象的 PEAD 因子。
2
长、短时间尺度的行为因子
先来看看捕捉长时间尺度的 FIN 因子,它使用上市公司股票发行(issuance)和回购(repurchase)计算。研究表明,由于具备信息优势,公司的管理层善于利用市场上已经形成的定价错误“择时”自己公司的股价:当他们认为公司股价过高时,往往会增发;而当公司股价被低估时,通常采取回购。另一方面,普通(非理性)投资者往往过度自信,导致对上市公司增发、回购行为反应不足,使得股价不会在短期修正。
大量(美股上)的实证表明,增发行为和未来的收益率负相关,而回购行为和未来的收益率正相关。为此,DHS 使用以下两个指标构建了他们的 FIN 因子:
1. 过去一年的 net-share-issuance(简称 NSI,出自 Pontiff and Woodgate 2008);
2. 过去五年的 composite-share-issuance(简称 CSI,出自 Daniel and Titman 2006)。
综合 NSI 和 CSI(取均值)就得到了 FIN 指标,越小越好。除此之外,DHS 采用了 Fama-French 三因子中的做法,使用 FIN 指标(按从小到大排名)和市值对上市公司进行了如下的 2 × 3 划分。
依上述划分,最终 FIN 因子定义为:
由于增发和回购有很多合规的要求,因此上市公司不可能频繁的使用。此外,如果哪个上市公司频繁的增发或回购也会导致投资者的怀疑。因此该因子的变化非常缓慢,而其对应的错误定价的修正也是在很长的时间尺度上才能完成的。它仅能解释长尺度上的异象(大于 1 年,通常 3 到 5 年),而对小于 1 年尺度上的异象无能为力。
为此,DHS 提出了第二个行为因子 —— PEAD。
我们对 PEAD —— post-earnings announcement drift —— 并不陌生。大量实证显示,拥有 positive earnings surprise 的公司的股票比 negative earnings surprise 的公司的股票在未来 6 到 9 个月内能获得更高的收益。之所以出现这种原因是因为投资者的有限注意力使得他们对最新的 earnings 新息反应不足(DellaVigna and Pollet 2009,Hirshleifer and Teoh 2003)。
为了捕捉上述反应不足,DHS 以上市公司最近的一个财报的披露日期为时间零点,计算 [-2, 1] 窗口内 —— 即披露之前两个交易日到披露后的一个交易日 —— 其相对于市场的累积超额收益率(cumulative abnormal return,简称 CAR)作为评价指标:
其中 R_{i,d} 为上市公司 i 在其最近一个披露期窗口内第 d 日的收益率;R_{m,d} 为市场在同期的收益率。由于投资者反应不足,该窗口内的收益率和未来的收益率正相关,因此该指标越大越好。和 FIN 的处理一样,使用 CAR(按从大到小排名)和市值对上市公司进行了如下 2 × 3 划分:
依上述划分,最终 PEAD 因子定义为:
以上就是长、短时间尺度上的行为因子 FIN 和 PEAD 的构建方法。对于 FIN 因子,每年六月更新一次;对于 PEAD 因子,每月更新。使用 FIN 和 PEAD 两个因子,再加上代表市场风险的 MKT 因子,DHS 提出了他们的复合三因子模型:MKT、FIN 和 PEAD。
下面就来看看这个新模型和其他主流多因子模型的异同。
3
不同模型比较
在比较不同的多因子模型时,Barillas and Shanken (2018) 指出:
... the model should be compared in terms of their ability to price all returns, both test assets and traded factors.
”这句话的意思是,一个优秀的多因子模型应该既能解释异象(test assets),又能解释其他模型中的因子(traded factors)。首先来看看 DHS 的两个行为因子能否解释其他主流模型中的因子。测试中考虑的其他多因子模型如下表所示(具体解释请参考《Anomalies, Factors, and Multi-Factor Models》)。
上述模型中,有些因子相同但是构建方法不同。比如 Fama-French 三因子和五因子模型中的 HML 因子和 Novy-Marx 四因子中的 HML 不同,为了区分,后者记为 HML(NM)。其他因子缩写遵循同样的命名原则。
下面两图显示了上述因子在实证日期内获取收益的能力和它们之间的相关性。
接下来看看不同因子模型的比较。在这方面,最简单的方法就是看不同模型之间的因子能否相互解释,遵循一种“如果我能解释你、但是你不能解释我,那我就比你 NB”的思路。首先来看看 DHS 的 FIN 和 PEAD 因子能否被其他模型解释。
下图表明,PEAD 因子可以获得其他模型无法解释的超额收益(α 那一列)。
对于 FIN 因子(下图),绝大对数已有模型无法解释,例外是 NM 和 SY4 模型。
再来看看 FIN 和 PEAD 因子联合起来能否解释其他模型中的因子。下图中左侧展示了仅考虑 FIN 和 PEAD 的结果,右侧展示了考虑 MKT、FIN 和 PEAD 这个三因子模型的结果。
结果显示 DHS 提出的三因子模型能够解释其他模型中绝大部分因子,然而 Fama-French 三因子中的 SMB、Novy-Marx 四因子中的 PMU 以及 HXZ4 四因子中的 IVA 因子可以获得 DHS 三因子无法解释的超额收益。其中,PMU 和 IVA 分别代表两个主流的维度 —— Profitability 和 Investment。DHS 的复合三因子模型对其解释力度较弱不免有些令人失望。另外一个无法解释的是 SMB 市值因子,我们会在本文第四节加以讨论。
最后来看看不同多因子模型解释异象的能力。DHS 从 Hou, Xue, and Zhang (2015) 考察的 73 个异象中找出了 34 个,其中短时间尺度异象 12 个、长时间尺度异象 22 个。使用不同的检验标准,DHS 比较了不同模型在解释这些异象方面的能力(下图)。
结果表明复合三因子模型解释了全部短时间尺度异象,其在这方面的表现优于所有其他模型。对于长时间尺度异象,DHS 在 5% 的显著性水平下解释了 22 个中的 19 个,其表现和 NM 以及 SY4 模型相当,优于其他多因子模型。如果把全部 34 个异象放在一起综合考虑,复合三因子模型战胜了其他全部模型。
从上述实证结果来看,DHS 的三因子模型和其他主流多因子模型相比,无论从解释因子还是解释异象上来说,都十分优秀。当然,它也有其不足之处,比如无法解释 PMU 和 IVA 这两个代表 profitability 和 investment 维度的因子。
除了上述比较外,DHS 还从因子的复杂度层面,基于 The Law of Parsimony(简约法则)的理念比较了不同的模型,并指出他们的模型由于有更少的因子和使用了更少的指标而在这方面有一定的优势。关于这方面的讨论,在之前的文章中已经有了介绍,这里不再赘述。
无论从实证数据的结果还是从模型简约程度来说,复合三因子模型确实让人眼前一亮。不过别急,在我们给它更多的赞美之前,有大佬有话要说。我们搬好小板凳看“神仙打架”。
4
质疑之声
为了庆祝 Richard Thaler 获得 2017 年诺贝尔经济学奖,2018 年美国金融协会年会上特地设立了一个 Behavioral Finance session(尽管 Thaler 获奖更多的是因为他在 Behavioral Economics 上的贡献)。在这个 session 中充分讨论了三篇论文(每篇一个 presenter 和 一个 discussant),而 DHS 就是其中一篇。
这篇文章的 discussant 正是来自 UPenn 的 Robert Stambaugh —— SY4 四因子模型的作者之一。他的模型被 DHS 用新复合三因子模型“狠狠”的对比了一番(尤其在本文没有包括的 Parsimony 部分),滋味可想而知(也许是我狭隘了),于是在讨论环节从四个方面“怼”了 DHS 模型。本节介绍两个方面。
第一个质疑是比较不同模型时选用的异象是否存在 data snooping。
Stambaugh 指出,DHS 既然用了 Hou, Xue, and Zhang (2015) 中涉及的异象,为什么只选了 34 个呢?这里面是否有有意或者无意的原因呢?他建议考察全部 73 个异象。除了 MKT 外,DHS 和 SY4 中共涉及 PEAD、FIN、PERF 和 MGMT 四个因子。对于每个因子,从这 73 个异象中排除和它最相关的 5 个,最终得到 58 个异象(其中 16 个短时间尺度、42 个长时间尺度)。考察这两个模型解释这些异象的能力,结果(下图)显示 SY4 战胜了 DHS —— Stambaugh 扳回一城。
第二个质疑是为什么不考虑 size 因子。
实证结果显示,DHS 的模型无法解释 Fama-French 模型中的 SMB 因子以及 SY4 中的 SMB 因子(下图)。大量的研究表明,股票收益率中存在显著的和 size 有关同步运动,而无论 FIN 还是 PEAD 因子在构建时,通过 2 × 3 划分刻意排除了 size 的影响,因此无法解释 size 因子。
基于此,Stambaugh 建议在 DHS 中加入 size 因子。Stambaugh 比较了 DHS 原模型(记为 BF3)和加入 size 因子的 BF4 模型在另外 11 个异象中的表现,不过结果显示加入 size 因子后,能解释的异象表少了(5% 显著性水平下显著的异象从 3 个增加到 6 个),这从侧面说明了 BF3 模型不是那么稳定(是否正因解释的异象变少了而没有加入 size 不得而知),还有很多的实证分析可以研究。Stambaugh 再下一城。
好了,对“神仙打架”的介绍到此结束。想通过它传达的是,没有一个模型是完美的,而我们需要时刻保持理性的态度,使用科学的手段,客观的评价不同模型的优劣。
5
结语
市场中的交易者都是非理性的,每个人带有不同程度的心理偏差,集体的心理偏差体现出长时间尺度上的过度自信和短时间尺度上的有限注意力,它们又进而造成了错误定价。以此为动机,DHS 提出了两个行为因子 FIN 和 PEAD,并加上市场因子 MKT 构建了复合三因子模型,为实证资产定价提供了新的思路。
得益于 Daniel Kahneman、Amos Tversky、Richard Thaler 等学者的开拓性研究,如今心理学和经济学以及金融学的融合已经广泛被人所接受。行为金融学也是在这个大潮中发展起来并逐渐占据了一席之地,对帮助我们理解市场、理解投资者的非理性行为提供了有力的武器。DHS 的复合三因子模型将这个思路延续到了实证资产定价中,是一个值得肯定的尝试。
参考文献
Barberis, N. and A. Shleifer (2003). Style investing. Journal of Financial Economics, Vol. 68(2), 161 – 199.
Barillas, F. and J. Shanken (2018). Comparing asset pricing models. Journal of Finance, Vol. 73(2), 715 – 754.
Carhart, M. M. (1997). On Persistence in Mutual Fund Performance. Journal of Finance, Vol. 52(1), 57 – 82.
Daniel, K. D., D. Hirshleifer, and A. Subrahmannyam (1998). Investor psychology and security market under- and overreactions. Journal of Finance, Vol. 53(6), 1839 – 1885.
Daniel, K. D., D. Hirshleifer, and A. Subrahmannyam (2001). Overconfidence, arbitrage, and equilibrium asset pricing. Journal of Finance, Vol. 56(3), 921 – 965.
Daniel, K. D., D. A. Hirshleifer, and L. Sun (2018). Short- and long-horizon behavioral factors. Columbia Business School Research Paper No. 18-5. Available at SSRN: https://ssrn.com/abstract=3086063.
Daniel, K. D. and S. Titman (2006). Market reactions to tangible and intangible information. Journal of Finance, Vol. 61(4), 1605 – 1643.
DellaVigna, S. and J. Pollet (2009). Investor Inattention and Friday Earnings Announcements. Journal of Finance, Vol. 64(2), 709 – 749.
Fama, E. F. and K. R. French (1993). Common Risk Factors in the Returns on Stocks and Bonds. Journal of Financial Economics, Vol. 33(1), 3 – 56.
Fama, E. F. and K. R. French (2015). A Five-Factor Asset Pricing Model. Journal of Financial Economics, Vol. 116(1), 1 – 22.
Hirshleifer, D. and S. H. Teoh (2003). Limited attention, information disclosure, and financial reporting. Journal of Accounting and Economics, Vol. 36(1), 337 – 386.
Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies, Vol. 28(3), 650 – 705.
Novy-Marx, R. (2013). The other side of value: The gross profitability premium. Journal of Financial Economics, Vol. 108 (1), 1 – 28.
Pontiff, J. and A. Woodgate (2008). Share issuance and cross-sectional returns. Journal of Finance, Vol. 63(2), 921 – 945.
Stambaugh, R. F. and Y. Yuan (2016). Mispricing Factors. Review of Financial Studies, Vol. 30(4), 1270 – 1315.