带群组结构的面板模型综述
一、前言
面板数据,也称“平行数据”或“TS-CS数据(Time Series - Cross Section)”,具有时间序列和截面两个维度。相较于时间序列数据或截面数据,面板数据通常具有更丰富的信息,常用于金融学、统计学、社会科学等领域的案例研究。下图为一个面板数据的示例,展示了不同人员在不同年份的薪资等信息。
面板数据的一个特点是个体之间存在异质性。在建模时,如果忽略个体之间的异质性,则可能会导致错误的模型设定,得到不相合的估计量,如果将所有个体之间的异质性纳入考虑,即每个个体的回归系数都不同,则可能会丢失个体之间的一些潜在联系。因此,综合这两方面的考虑,一些学者尝试在面板模型中引入群组结构:属于同一群组的个体共享一个相同的参数,而不同群组之间的参数是不同的。近年来,带群组结构的面板模型逐渐成为面板数据分析中的常用模型,本文对这一模型的估计方法做一简要回顾。
二、相关研究梳理
1、面板数据与模型的表示
线性面板模型: Logit面板模型:,服从Logistic分布,为指示函数
在传统的面板数据建模中,针对个体之间的异质性,通常有两种不同的建模策略:一种是忽略这种异质性,假定回归参数在个体间是同质的,而个体之间的异质性由不可观察的固定个体效应刻画(见Hsiao and Tahmiscioglu, 1997; Lee, Pesaran, and Smith, 1997; Durlauf, Kourtellos, and Minkin, 2001; Phillips and Sul, 2007a; Browning and Carro, 2007, 2010, 2014; Su and Chen, 2013);另一种策略是假定每个个体的回归参数与其他个体不同,是完全异质的(见Baltagi, Bresson, and Pirotte, 2008; Hsiao and Pesaran, 2008)。如前文所讲,这两种建模策略都存在一定的问题,因此带群组结构的面板模型近年来开始受到研究者的广泛关注。
2、基于有限混合模型的方法
与此同时,定义:
以及
3、基于K均值聚类的方法
4、基于Lasso的方法
以上的研究都是聚焦于线性的面板模型,未涉及到非线性的面板模型,同时针对模型估计的理论性质的研究还不够完善。因此,Su et al. (2016)提出了一种类似Lasso的方法,称之为C-Lasso,该方法可以应用于非线形模型,其核心思想是定义一种新的目标函数:
三、实际数据应用解读
正如前文所述,带群组结构的面板模型在经济学、统计学、社会学等领域有着十分广泛的应用,这里介绍一个分析总量生产函数的例子。
总量生产函数是指反映总产出量与投入的各种生产要素量的关系的函数,是经济学中的一个重要概念,对经济学家了解经济增长、技术变化、各国生产率差异和生产效率具有重要作用。分析数据来源于Penn World Table,包含43个国家在1950年到2014年期间的生产数据。利用线性模型
四、总结与展望
五、参考文献
[1] Azzali, I., Vanneschi, L., Silva, S., Bakurov, I., & Giacobini, M. (2019, April). A vectorial approach to genetic programming. In European Conference on Genetic Programming (pp. 213-227). Springer, Cham.
[2] Hsiao, C., & Tahmiscioglu, A. K. (1997). A panel analysis of liquidity constraints and firm investment. Journal of the American Statistical Association, 92(438), 455-465.
[3] Lee, K., Pesaran, M. H., & Smith, R. (1997). Growth and convergence in a multi‐country empirical stochastic Solow model. Journal of applied Econometrics, 12(4), 357-392.
[4] Durlauf, S. N., Kourtellos, A., & Minkin, A. (2001). The local Solow growth model. European Economic Review, 45(4-6), 928-940.
[5] Phillips, P. C., & Sul, D. (2007). Bias in dynamic panel estimation with fixed effects, incidental trends and cross section dependence. Journal of Econometrics, 137(1), 162-188.
[6] Browning, M., & Carro, J. (2007). Heterogeneity and microeconometrics modelling. Econometric Society Monographs, 43, 47.
[7] Su, L., & Chen, Q. (2013). Testing homogeneity in panel data models with interactive fixed effects. Econometric Theory, 29(6), 1079-1135.
[8] Baltagi, B. H., Bresson, G., & Pirotte, A. (2008). To pool or not to pool?. In The econometrics of panel data (pp. 517-546). Springer, Berlin, Heidelberg.
[9] Hsiao, C., & Pesaran, M. H. (2008). Random coefficient models. In The econometrics of panel data (pp. 185-213). Springer, Berlin, Heidelberg.
[10] Sun, Y. (2005). Estimation and inference in panel structure models. Available at SSRN 794884.
[11] Lin, C. C., & Ng, S. (2012). Estimation of panel data models with parameter heterogeneity when group membership is unknown. Journal of Econometric Methods, 1(1), 42-55.
[12] Sarafidis, V., & Weber, N. (2015). A partially heterogeneous framework for analyzing panel data. Oxford Bulletin of Economics and Statistics, 77(2), 274-296.
[13] Bonhomme, S., & Manresa, E. (2015). Grouped patterns of heterogeneity in panel data. Econometrica, 83(3), 1147-1184.
[14] Ando, T., & Bai, J. (2015). Asset pricing with a general multifactor structure. Journal of Financial Econometrics, 13(3), 556-604.
[15] Su, L., Shi, Z., & Phillips, P. C. (2016). Identifying latent structures in panel data. Econometrica, 84(6), 2215-2264.
[16] Lu, X., & Su, L. (2017). Determining the number of groups in latent panel structures with an application to income and democracy. Quantitative Economics, 8(3), 729-760.
[17] Su, L., & Ju, G. (2018). Identifying latent grouped patterns in panel data models with interactive fixed effects. Journal of Econometrics, 206(2), 554-573.
[18] Su, L., Wang, X., & Jin, S. (2019). Sieve estimation of time-varying panel data models with latent structures. Journal of Business & Economic Statistics, 37(2), 334-349.
[19] Liu, R., Shang, Z., Zhang, Y., & Zhou, Q. (2020). Identification and estimation in panel models with overspecified number of groups. Journal of econometrics, 215(2), 574-590.
- END -