面板数据,也称“平行数据”或“TS-CS数据(Time Series - Cross Section)”,具有时间序列和截面两个维度。相较于时间序列数据或截面数据,面板数据通常具有更丰富的信息,常用于金融学、统计学、社会科学等领域的案例研究。下图为一个面板数据的示例,展示了不同人员在不同年份的薪资等信息。
线性面板模型: Logit面板模型:,服从Logistic分布,为指示函数
在传统的面板数据建模中,针对个体之间的异质性,通常有两种不同的建模策略:一种是忽略这种异质性,假定回归参数在个体间是同质的,而个体之间的异质性由不可观察的固定个体效应刻画(见Hsiao and Tahmiscioglu, 1997; Lee, Pesaran, and Smith, 1997; Durlauf, Kourtellos, and Minkin, 2001; Phillips and Sul, 2007a; Browning and Carro, 2007, 2010, 2014; Su and Chen, 2013);另一种策略是假定每个个体的回归参数与其他个体不同,是完全异质的(见Baltagi, Bresson, and Pirotte, 2008; Hsiao and Pesaran, 2008)。如前文所讲,这两种建模策略都存在一定的问题,因此带群组结构的面板模型近年来开始受到研究者的广泛关注。
以上的研究都是聚焦于线性的面板模型,未涉及到非线性的面板模型,同时针对模型估计的理论性质的研究还不够完善。因此,Su et al. (2016)提出了一种类似Lasso的方法,称之为C-Lasso,该方法可以应用于非线形模型,其核心思想是定义一种新的目标函数:
总量生产函数是指反映总产出量与投入的各种生产要素量的关系的函数,是经济学中的一个重要概念,对经济学家了解经济增长、技术变化、各国生产率差异和生产效率具有重要作用。分析数据来源于Penn World Table,包含43个国家在1950年到2014年期间的生产数据。利用线性模型
