查看原文
其他

COVID-19 大流行期间的非正规经济

FinTech研究所 人大金融科技研究所 2023-03-28

本文使用来自中国最大的金融科技公司的大约 8000 万线下微型企业 (OMB) 所有者的交易级业务数据,并采用机器学习方法进行因果推理,提供了在 COVID-19 打击后脆弱的非正规经济的初步视图。本文发现中国的 OMB 活动在低谷期间立即急剧下降了 50%。在 COVID-19 爆发七周后,这些业务已反弹至应有的水平的 80% 左右,但一直保持在这一水平,直到我们的时间窗口结束。我们发现城市地区的 OMB、女性商人和不是在她们开展业务的地方长大的商人受到了更大的破坏。我们讨论了对最弱势群体的政策支持的影响,并强调了充分利用数字发展来跟进非正规经济的重要性。中国人民大学金融科技研究所(微信ID:ruc_fintech)对文章的核心部分进行了编译。

来源 | China Economic Review

作者 | 郭峰,黄益平,王靖一 ,王雪

 | 李彦洁


Part 1


获得有关非正规经济的准确统计数据已成为大多数发展中国家最艰巨的挑战之一,尤其是考察他们在诸如 2019冠状病毒大流行期间的情况。即使大流行对整个社会造成了沉重打击,它也会对非正规工人造成不成比例的打击。例如,街头小贩主要从事服务业,通常是个体户或没有社会保险的非正规就业,主要在微型和家庭企业。准确衡量非正规经济的规模并检查他们认为的影响对于做出有效的经济政策决策很重要。在中国,由于经济的快速数字化,这正在成为可能,因为使用数字支付工具支付已经成为一种日常现象。根据中国人民银行的数据,2018 年成年人使用数字支付的比例为 82.39%。中国最大的两家数字支付服务提供商支付宝和微信支付的国内用户已超过 9 亿。人们使用数字支付工具进行线上和线下交易,甚至街边小店、小贩等小企业也采用了支付宝、微信支付、银联等数字支付方式。数字信息的积累使我们能够大致估计非正规部门的规模,并衡量它们受到 COVID-19 大流行的打击程度。


在中国,封锁和社会疏离措施等行动限制极大地遏制了疾病的传播,国内新增病例数在2020年三月已经得到控制。然而,严厉的封锁等激进的反制措施也在短期内给该国带来了巨大的经济成本。2020年第一季度,中国经济同比萎缩6.8%,是过去四年来的首次收缩。因此,弱势群体的收入和生计可能正在恶化。中国走出了两个月的遏制阶段,并于 2020 年 4 月上旬进入缓解阶段。在本文中,我们探讨了中国线下微型企业 (OMB) 在非正规部门所感受到的影响,这些非正规部门主要是服务业的个体经营者,他们无法在家工作。
数以千万计的 OMB 受到大流行和封锁措施的严重影响。首先,OMB 主要在经济的非正规服务部门运作,他们通常是个体经营者或非正规就业者,没有社会保险。大多数 OMB 雇用在大流行期间无法在家工作的低技能工人。其次,大多数 OMB 只能勉强生存,储蓄有限,无法获得失业救济金。由于储蓄有限,他们严重依赖现金流和短期贷款。那些在零工经济中就业的人特别容易受到收入急剧下降和生计损失的影响。对这一群体的负面影响可能会产生长期影响,并且是导致持续不平等和低流动性的主要原因。

本文使用中国最大的金融科技公司蚂蚁集团(以下简称“蚂蚁”)每周对约 8000 万“二维码商户”(中文称“码商”)的数据,研究 COVID-19 对 OMB 的初步影响及其自 该病毒已基本得到控制。二维码商户是通过蚂蚁的数字支付工具支付宝收款的OMB。官方公开的统计数据之一是注册的个体企业约为 1 亿,这与我们的样本相当,包括约 8000 万 OMB。我们的样本跨度为 2019 年 12 月 31 日至 2020 年 4 月 2 日以及相应的 2018 年和 2019 年农历日期。我们使用农历日期来说明农历新年期间经济活动的季节性。2020 年 1 月 20 日是 COVID-19 控制和预防的一个重要日子,当时确认了冠状病毒的人际传播并向公众报告。因此,我们在下面的分析中将这一天作为爆发的开始和事件的日期。我们将 1 月 20 日之前和之后的时期分别定义为病毒前和病毒后时期。我们使用 2018 年和 2019 年相应的农历日期来定义病毒前后的时期。

OMB 活动的简单同比变化将导致对大流行的实际经济影响的误测,因为如果没有 COVID-19 大流行。我们首先使用机器学习技术预测反事实,并进一步将已实现和反事实结果之间的差异解释为大流行的因果影响。具体来说,我们将 OMB 数据与泰森多边形级别的其他经济、人口和地理特征相结合。我们通过建模 OMB 在 后病毒时期和其他特征变量。特征变量包括上一年同期的 OMB 活动、2020 年 COVID-19 爆发前几周的 OMB、截至 2019 年 12 月的经济环境、人口和地理等横截面数据,以及面板数据如 2020年气象特征。参数来自使用2018年和2019年数据训练的梯度提升决策树(GBDT)模型,揭示了2019年病毒后时期OMB活动与特征变量之间的关系 . 预测的反事实与 2020 年的实际值之间的差异可以估计大流行对 OMB 的实际影响。
我们发现,在后病毒时期,中国活跃 OMB 的数量和销售额大幅下降。活跃商户数量和销售额在后疫情时期的第二周(1月31日至2月6日)触底,随后三周持续低迷。相对于机器学习技术估计的反事实水平,在 1 月 31 日至 2 月 20 日期间,活跃商家的数量和销售额平均每周下降 50% 左右,之后 OMB 活动开始反弹。截至 4 月初,在谷底一个月后,OMB 活动反弹至其反事实水平的 80% 左右。此外,我们发现政府宣布的封锁政策可以解释 OMB 活动总体下降的部分原因,而最重要的可能是自愿遏制措施。
城市地区的 OMB 受到的打击最为严重。城市地区活跃商户数量下降幅度最大,约为 54%,而农村地区则下降了 41%。此外,我们看到整个 2 月份的商业活动同时收缩,随后从 2 月底开始在全国范围内同步复苏,尽管病毒的传播存在地区差异。低谷期间,女性商家的活跃 OMB 数量和销售额分别下降了约 53% 和 57%,降幅比男性商家的平均下降幅度约 5% 和 9%。外来者(非出生在其经商省份的所有者)的经济活动下降幅度更大,活跃商人数量的下降幅度大于在其出生省份经营业务的本地人的数量下降了 7%。一般来说,外地人享受不到当地人同等的社会福利,更容易受到冲击。
尽管对 COVID-19 的研究正在快速增长,但据我们所知,我们的论文是第一篇研究受大流行和封锁措施严重打击的 OMB 的影响的论文。鉴于 COVID-19 和以前的大流行病的严重破坏,其他研究侧重于传播、遏制以及经济和政治后果,包括检查中国注册公司在 Covid-19 冲击中的暴露程度如何随县级集群指数(衡量相关行业公司的空间集聚度)而变化。
然而,很少有研究估计对在 COVID-19 大流行期间特别容易遭受严重崩溃的非正规工人的实际影响。
此外,我们为更广泛的非正规经济文献做出了贡献。非正规企业本质上很难识别,因为它们中的大多数通常是小规模的、经常以家庭为基础的、生产力低下的企业,具有很多非正规性,几乎没有社会保障记录。然而,诸如 OMB 之类的非正规经济对就业做出了重大贡献,尤其是在发展中国家。亚太地区的非正式工人占非农就业人数的近 60%,从日本的 20% 左右到缅甸和柬埔寨的 80% 以上不等。中国的 OMB 主要在非正规服务部门运营,其中大多数疫情期间不在家工作。我们利用来自全球最大金融科技公司的数据,利用他们的数字足迹,识别零工经济中的非正规企业。


Part 2

数据描述


尽管对中小型企业 (SME) 的研究正在迅速发展,但提供有关微型企业经济活动信息的国家数据集却很少,尤其是那些未在工商部门注册的微型企业的经济活动信息。我们使用蚂蚁集团 2019 年 12 月 31 日至 2020 年 4 月 2 日以及 2018 年和 2019 年相应农历日期的约 8000 万二维码商户的周数和销售额数据。1 月 20 日,中国当局证实了冠状病毒的人际传播,这标志着不断演变的大流行的管理和控制方式发生了巨大变化。因此,我们将 1 月 20 日(农历 12 月 26 日)之前和之后的时期分别定义为病毒前后时期,相应的农历日期分别为 2018 年和 2019 年的同一时期。农历 2020 年的除夕是 1 月 24 日,即活动日期后的 4 天,通常有 7 天的农历新年假期。因此,后病毒时期的第一个时间段包括农历新年的前三天和之后 的7 天,考虑到假期的潜在影响。


我们建议在泰森多边形级别聚合 OMB 数据。泰森多边形,也称为 Voronoi 图,是分析邻近度和邻域的基本方法。 该方法定义围绕中心点的区域,其中每个位置都比其他位置更靠近该点。在我们的分析中,与到任何其他中心点的距离相比,属于特定泰森多边形的每个 OMB 离自己的中心点最近。我们将每个 500 米网格单元内的银行网点合并为一个为中心点,取其地理坐标的平均值,最终在中国大陆建立 138,629 个多边形。


此外,我们收集了可能影响 OMB 活动的变量的栅格数据,例如经济发展、人口和地理特征。OMB 的客户主要在附近,因为 OMB 离线且规模较小,而 OMB 的周边环境在其日常业务中发挥着重要作用。首先,鉴于病毒的传播和 OMB 活动对天气的敏感性,我们将气象条件包括在分析中,例如温度、风速、气压、湿度和降水。其次,我们在 2019 年 12 月从高德应用程序接口获取了大约 3500 万个“兴趣点” 的数据,以代表当地的一般情况。第三,我们有截至 2019 年 12 月的横截面数据,包括栅格经济发展、人口和地理变量,特别是 500 米空间分辨率的夜间灯光数据、1000 米网格单元级别的人口数据和海拔 在 30 米网格单元级别。我们进一步计算了多边形中心到县、地级市和省会城市的行驶距离,反映了多边形层面的交通便利性。

 

Part 3

模型规范


为了估计大流行对 OMB 的真正影响,我们需要预测没有 COVID-19 爆发的 OMB 经济活动的反事实水平。实际交易和反事实之间的差异将说明真正的下降。大多数关注 COVID-19 的经济影响的研究在差异 (DID) 规范中使用线性回归,但在我们的设置和数据框架中,我们记录了与线性 DID 规范相关的两个问题会导致估计有偏差。首先,尚不清楚解释变量,包括前一年和病毒前期间的经济、人口、地理特征和OMBs活动,是否与病毒后期间OMBs活动的变化呈线性相关。此外,也不清楚在这几十个变量中,哪些因素是最相关的。
运行厨房水槽回归的结果是,我们可能会冒过度拟合数据并估计回归量和回归量之间虚假关系的风险。相反,我们依赖一种称为 GBDT 的机器学习方法。GBDT 不仅允许大型条件信息集,而且还允许非线性,而不会过度拟合或成为所谓的维度灾难的牺牲品。其次,在 DID 估计器中确定治疗效果的核心假设是平行路径假设,即在没有治疗的情况下,治疗的结果的平均变化等于未治疗的结果的平均变化。然而,中国的二维码商户从 2018 年开始就经历了快速增长,而这两年还在增长的路上。在没有 COVID-19 大流行的情况下,2020 年 OMB 活动的平均增长很难达到 2019 年的水平,这使平行路径假设无效。事实上,我们测试了 2019 年和 2020 年病毒前时期活跃 OMB 的数量和销售额的路径,确实发现了一个非平行的前趋势。我们采用 GBDT 和非参数估计的设置允许 OMB 活动对特征变量的更灵活的动态响应。我们模型中的基本假设是,2019 年 OMB 的增长路径与输入与响应变量的“关系”在 2020 年仍然成立,从而放宽了对结果变量平均变化的限制。

更具体地说,在我们的设置中,我们利用病毒后时期 OMB 的活动与包括同一病毒时期的 OMB 在内的特征变量之间的关系来预测病毒后时期 OMB 活动的反事实水平。前一年,2020 年 COVID-19 爆发前几周的 OMB,2020 年的经济状况、人口以及地理和气象特征。参数来自使用 2018 年和 2019 年相同数据框的训练 GBDT 模型,它揭示了 2019年后病毒时期OMBs活动与特征变量的关系。这一估计背后的假设是,如果没有 COVID-19 爆发,2019 年病毒后时期 OMB 的业务活动与特征变量之间的关系将在 2020 年仍然存在。下面的方程(1)显示了 2020 年反事实 OMB 活动的预测模型:



其中 ̂ OMBi,2020+k 表示如果没有大流行,在 2020 年病毒后时期的第 k 周,多边形 i 的泰森多边形级别的活跃 OMB 的预测数量或销售营业额。OMBi, 2020− h (OMBi, 2019− h) 是 2020 年(2019 年)疫情爆发前三周(即 h = 1,2,3)多边形 i 中 OMB 活动的向量,包括商家数量以及相关的销售额。OMBi, 2019+k (OMBi, 2019+(k-1)) 包括 2019 年病毒后第 k (k-1) 周多边形 i 中的 OMB 活动。Xi, 2020+k 是包含气象变量的向量,Zi 包含经济、人口和地理特征。模型(1)中的参数是从模型(2)中借用的,该模型对 2019 年病毒后时期的 OMB 活动与 2018 年和 2019 年使用相同数据结构的特征变量之间的关系进行建模。基本假设是条件 如果在相对较短的时间内(在我们的环境中为两年)没有外部冲击,OMB 的业务活动分布将是稳定的。鉴于 COVID-19 爆发恰逢农历新年,期间经济活动表现出明显的周期性,我们认为我们的估计在很大程度上是可靠的。这是模型(2):其中 OMBi, 2019+k 是 2019 年病毒后第 k 周多边形 i 中活跃 OMB 的数量或销售营业额。用于估计病毒后每周活跃 OMB 数量和销售额的特征变量 2019 年期间包括 2018 年同期的 OMB 活动、2019 年 COVID-19 爆发前几周的 OMB、截至 2019 年的经济环境、人口和地理等横截面数据,以及气象特征等面板数据 2019. 我们在泰森多边形级别训练梯度提升决策树 (GBDT) 模型。

Part 4

结果


4.1 COVID-19的直接结果


 图1 随时间变化的实际与预测OMB活动


图 1 通过显示活跃 OMB 的数量和销售营业额的高峰和低谷,提供了 COVID-19 影响的图形说明。左图显示了 2020 年和 2019 年同期每周活跃 OMB 的数量,而右图显示了销售营业额,均按 2018 年时间窗口第一周的平均值缩放。我们检查了有效性 我们以两种方式预测的反事实。首先,我们预测 2019 年相应农历周内活跃 OMB 的数量和销售量,即模型(1)中 2019 年 1 月 31 日之后 10 周的预测结果。图 1 中的黑色虚线显示了 2019 年的预测路径,而黑色实线显示了实际路径。黑色虚线和实线可能不太容易区分,因为它们在很大程度上重叠,表明我们模型预测的 OMB 数量和销售额非常接近于 2019 年的实际值。其次,我们预测了 OMB 的数量和销售额。2020 年病毒爆发前的 OMB 遵循模型 (1) 和 (2) 中的类似设置,但将事件日期向后移动了三周。换句话说,我们假设伪事件日期为2019年12月30日,并遵循第3节中模型的基本逻辑,预测2019年12月30日至2020年1月20日之间的OMBs活动。这样,2019年12月30日至2020年1月20日这几周是伪病毒后期。用于预测这三周内OMBs活动的参数是使用前两年的数据估计的参数。


图 1 中的红色虚线显示了 2020 年的预测路径,而红色实线显示了实际路径。我们看到 2020 年病毒前时期的预测路径与实际路径(第 -1、-2 和 -3 周)基本一致,这意味着 2019 年病毒前时期特征变量与 OMB 活动之间的关系确实 在 2020 年同一时期保持不变。因此,如果没有 COVID-19 大流行,这至少似乎更合理地认为,在真正的病毒后时期(2020 年 1 月 20 日之后的几周)中的关系在 2020 年也是稳定的。


我们首先探讨了大流行如何影响业务运营。图 1 显示,最糟糕的情况发生在农历新年假期结束时。2020年系列与2019年系列之间的差距在后病毒时期的第二周变得更大,并且在第四周(2020年2月14日至20日)差距最大。仅与 2019 年相比,对 OMB 的负面经济影响已经显而易见。但是,我们应该更好地回答这个问题:OMB 活动下降了多大?如果没有大流行,答案取决于爆发后时期的反事实路径。


图2 OMB活动的变化


然后,我们详细探讨了对 OMB 活动的影响。图 2 根据 OMB 的数量和销售营业额显示了实际值与其反事实之比的时间序列。比率为 1 表明 OMB 的实际经济活动完全处于应有的水平,比率越小,商业活动下降幅度越大。该比率与 1 之间的差异表示活跃 OMB 的每周数量和销售营业额相对于其反事实的百分比变化。


图 2 显示,OMB 活动直到病毒后时期的第二周才触底。前 10 天跌幅较小的主要原因有两个。首先,疫情后初期出现季节性下降,大多数商家关门歇业,享受假期,但影响尚未显现。其次,较小的下降与消费者的囤积行为一致,因为越来越明显的是,中国将出现大量病毒病例。我们的总体估计是,活跃的 OMB 商家数量下降了约 50%(黑线,0.5–1 = - 0.5),以应对疫情和最糟糕时期的关闭。营业额在第二周下降了52%(红线),随后两周持续低迷,第五周出现反弹。随着疫情得到控制,出行限制逐步放宽,政府为复工提供便利。相对于 2020 年的反事实,3 月份(后病毒时期的第七周,2020 年 3 月 6 日至 12 日)活跃 OMB 的数量和销售营业额分别反弹至 77% 和 78% 左右。2018 年中国的 OMB 数量约为 9776 万,13 从业人员约为 2.3 亿。如果所有 OMB 的活跃商户数量都经历了与二维码商户类似的收缩,那么在最糟糕的时期,中国大约有 1.15 亿(= 0.5 * 2.3 亿)以前的个体经营者失业,占 2018 年约占总劳动力的 14.3% (= 115/806)。这是一个非常粗略的估计,因为我们试图提供 OMB 活动整体收缩的感觉。


4.2 将锁定效果与整体影响分开


在病毒爆发后的十周内,我们看到活跃 OMB 的数量和销售营业额立即下降并部分恢复。然而,尚不清楚经济下滑是来自封锁令,还是病毒带来的恐慌和自发的呆在家里的意愿。政府法规可以解释多少这种崩溃的问题在数据中并不是很明显。在本节中,我们估计锁定如何影响 OMB 的经济活动。COVID-19流行的严重程度因地区而异,封城的具体条款和要求也因省市而异,这给确定封城政策的生效日期带来了巨大挑战。


然而,由于政策生效日期的各种测量之间的差异导致的误测不太可能超过一周,当我们定义生效周时,挑战在很大程度上得到缓解。因此,我们遵循 He、Pan 和 Tanaka(2020)从媒体新闻和政府公告中获得的有关地方政府在城市层面的封锁政策的信息。信息覆盖了324个城市,其中95个城市被完全封锁。为了评估政府法规对 OMB 活动的影响,我们采用了交错的 DID 规范。DID 模型利用了各城市封锁政策有效周的变化,从而估计了 2020 年城市封锁相对于非封锁城市如何抑制 OMB 的活动。这种经验策略使我们能够控制可能影响 OMB 的各种混杂因素 活动,并解开病毒遏制措施的合理清洁影响。值得注意的是,第 3 节中与 DID 估计相关的可能问题来自于比较 2020 年 COVID-19 爆发对 OMB 的影响相对于前一年的趋势,这与此处确定地方政府法规的影响不同。我们首先测试预处理平行趋势假设,并使用以下事件研究方法调查影响的动态演变:

其中 OMBi, c, k 是第 k 周多边形 i 和城市 c 的 OMB 数量或销售营业额的对数。Lockdownc, j 在锁定政策生效前的第 j 周内 c 市的每个多边形中的 OMB 取值为 1,否则为 0。Lockdownc 在锁定后的第 l 周内,对于城市 c 的多边形中的 OMB,l 取值为 1,否则为 0。Xi, c, t 是一个时变控制变量的向量,包括新确诊病例、新死亡病例和气象变量。术语 uc 和 vk 分别捕获多边形和周固定效应,以吸收 OMB 的多边形级别和时间趋势的时间不变因素。


图3 封锁效应的动态演变


图 3 绘制了事件研究回归中锁定变量的估计系数。我们发现,前导项(j = -1,-2,-3)的估计系数与零没有显着差异,这意味着在城市封锁之前,治疗组和对照组之间的趋势没有系统性差异 . 因此,我们假设在没有锁定的情况下,两组的平行趋势将保持不变。此外,我们可以看到滞后项 (l > 0) 是负数且具有统计显着性。在锁定后的前七周,活跃 OMB 的数量下降了 4% 到 8%,而同期 OMB 的销售额下降了 6% 到 11 个百分点。自封锁后的第七周以来,封锁的平均影响变得温和,这与一些城市当时开始解除封锁政策并希望这会重启经济的事实是一致的。


然后,我们通过比较治疗组(封锁城市)相对于对照组(非封锁城市)中 OMB 活动的平均变化来估计封锁政策的平均影响。我们已经看到大多数城市从 2020 年 1 月 20 日之后的第七周开始废除了他们的封锁规定,因此,我们将数据集保持在从第 -3 周到第 6 周,即第 6 周。2019 年 12 月 31 日至 2020 年 3 月 5 日,以防止地方政府法规解除的影响。我们按照标准 DID 回归评估锁定政策的总体影响:

其中 OMBi, c, k 是第 k 周多边形 i 和城市 c 的 OMB 数量或销售营业额的对数。Lockdownc, k 在锁定政策生效后的第 k 周内,对于城市 c 中每个多边形中的 OMB 取值为 1,否则为 0。Xi, c, k 是一个时变控制变量的向量,与等式中的相同。术语 uc 和 vk 分别捕获多边形和周固定效应。


表1 封锁政策的效应


表 1 给出了等式的估计结果。 第 (1) 和 (2) 列显示了对活跃 OMB 数量的估计影响。锁定项的系数为 − 0.08,在 1% 的水平上具有统计显着性。结果表明,与没有正式封锁政策的城市的 OMB 相比,在包括天气控制、多边形和周固定效应的情况下,活跃 OMB 的数量下降了 8 个百分点。我们进一步将每个城市的每周新增确诊病例和死亡人数包括在内,以控制 COVID-19 流行率,发现活跃 OMB 的数量下降了 5.9%,这表明活跃 OMB 数量的变化是由 城市封锁不能完全用病毒本身来解释。第 (3) 和 (4) 栏报告了对活跃 OMB 销售营业额的估计影响。平均而言,由于锁定政策,活跃的 OMB 的销售营业额损失了 11.2%。此外,控制新确诊病例和死亡人数将估计影响降低至 7.7%。


证据表明,与我们在第 4.1 节中估计的 COVID-19 爆发造成的约 50% 的总体崩溃相比,政府宣布的锁定政策对 OMB 活动的估计影响相对较小。一方面,导致OMB苦苦挣扎的因素有很多,例如焦虑的人可能会自行保持身体距离,避免与他人互动,其他城市的病毒控制措施也可能影响业主的生活。即使他们自己的城市没有被封锁,企业也是如此。另一方面,我们注意到我们的分析中有一些警告,我们可能会低估锁定政策的影响。事实上,在地方政府正式宣布封锁政策之前,许多村庄和社区已经采取了严格的病毒控制措施,因为他们担心要对社区传播负责。然后对照组(非封锁城市)实际上被部分封锁,尽管程度非常有限,但是没有可用的数据集可以准确衡量这种封锁政策的程度。更保守地说,我们可以将估计的影响视为官方锁定公告的影响,因此我们记录了政府锁定政策的公告可以解释 OMB 整体下降的有限部分,而最重要的可能是 事实上的自愿遏制措施。


4.3. 对城乡地区的影响


我们继续研究对城市和农村地区 OMB 的经济影响。我们根据 2019 年栅格夜间灯光数据的分类,将多边形分为两类区域,反映了经济活动水平的变化,城市地区更为活跃。为了匹配我们数据的粒度,我们依靠夜间灯光和人口数据将泰森多边形分为城市和农村地区。美国国家海洋和大气管理局提供 500 米像素级别的 Suomi 国家极地轨道伙伴关系可见红外成像辐射计套件 (VIIRS) 夜间灯光数据,地球观测系统数据和信息系统提供 1 公里的网格化人口数据 公里像素级别。VIIRS 夜间灯光数据已被广泛用于城市经济研究中及时准确地提取城市土地面积 。遵循 Dou 等人提出的方法 (2017)、Henderson、Yeh、Gong、Elvidge 和 Baugh (2003),以及 Shi 等人(2014),我们使用局部优化阈值(LOT)来提取城市土地。通常,LOT根据辅助数据(如社会经济数据、中高分辨率遥感数据等)确定最佳阈值,并将夜间光照亮度大于最佳阈值的区域提取为城市区域。


我们采用与 Dou 等人类似的方法来确定建成区提取的最佳阈值。首先,使用行政边界的掩模多边形从全局数据集中提取每个城市的两种类型的夜间灯光图像。然后,使用最小数字值的阈值将图像划分为城市区域和非城市区域。记录使用 VIIRS 夜间灯光数据提取的区域与参考数据之间的绝对差异。


通过增加阈值来迭代这些过程,直到达到图像的最大像素值。选取产生差异最小的阈值作为城市建成区提取的阈值。我们将1公里分辨率的人口栅格数据平均分配到500米的栅格单元中,即每个1公里的栅格单元被分成4个500米的栅格单元。这样,我们根据夜间灯光数据将居住在上述子区域的人口相应地分为两组。在本文中,一个多边形可能包含许多 500 米的网格单元,它们可能是不同的子区域。因此,我们建议根据大部分人口(超过 50%)居住的次区域对多边形进行分类。例如,如果多边形中超过 50% 的人口居住在市区,我们会将这个多边形归类为市区。


图4 城乡OMB的变化


图 4 显示,与农村地区的 OMB 相比,城市地区受到的打击更大。左(右)面板显示了活跃 OMB 的数量(销售营业额)与其在病毒后时期的反事实的比率。第二周,活跃的 OMB 数量下降幅度最大,城市和农村地区分别下降了 54% 和 41%。就销售周转而言,农村地区的 OMB 销售额下降了 43%,而城市地区的下降幅度更大,为 54%。农村第三周成交额回升至66%,较前一周增长9%,而城镇成交额直到第五周才开始回升。城市地区受到的冲击最为严重,这表明疫情爆发后的大规模封锁对之前经济较为活跃的地区造成了更大的破坏。然而,在第 7 周,也就是 3 月初,相对于反事实的 OMB 活动开始在城市和农村地区收敛到相似的水平。


对于城市地区的更大破坏,有三种可能的解释。首先,在最糟糕的时期,由于人口密度更高,传播风险更高,城市社区比农村施加了更严格的限制,这直接导致了 OMB 活动的急剧下降,这似乎是合理的。二、住宅区和商业区在大多数城市地区是分开的,而社区内的流动性限制限制了家庭的线下消费。然而,大多数农村的 OMB 都在村里,家庭可以在不违反流动限制的情况下外出购物。第三,在中国,大多数农民工在春节假期回乡,主要是农村地区。与没有大流行时的反事实消费需求相比,延迟重返工作岗位的移民的消费需求部分减轻了 COVID-19 对农村 OMB 的影响。此外,由于农村人口密度相对较低,农村 OMB 将更愿意开始运营。


4.4 业主人口统计的影响


我们进一步估计了子样本中不同性别群体的影响,并通过区分所有者是否出生在居住地来研究影响的异质性。我们分别预测每个多边形中男性和女性所有者的反事实活跃 OMB 数量和销售营业额。我们以图形显示 OMB 的实际活动与其反事实的比率,比率为 1 表示 OMB 的实际数量和销售营业额与没有 COVID-19 时应该达到的水平相同 大流行,比率与 1 之间的差异表示商业活动下降的百分比。

图5 男女OMB的变化


图 5 显示,女性业主的下降幅度大于男性业主,在低谷期间,商家数量和销售额周平均下降约 53% 和 57%,而男性下降在最糟糕的一周,业主的商户数量和交易价值都为 48%。这一发现表明,女性 OMB 所有者受到了 COVID-19 大流行的不成比例的打击,并且在控制病毒传播显然是首要任务的几周内,她们可能生活在更艰难的条件下。我们发现图 5 右图的红线始终位于黑线下方,说明女性商家的销售额下降幅度始终大于男性业主。在我们的样本期结束时,即 COVID-19 爆发后的第十周,男性商家的销售营业额相对于他们的反事实水平分别反弹至 80% 左右。然而,女商人恢复了75%的生意。女性 OMB 所有者遭受的重创可能会产生长期影响。


图6 国内外人OMB的变化


我们通过区分所有者是否出生在居住地来探索对不同 OMB 的异质影响。对于出生在他或她开展业务的同一省份的所有者,我们将他们分类并标记为本地人。我们将其他并非出生在他们经营企业的省份的所有者标记为局外人。例如,如果 OMB 所有者 A 出生在 B 省并在 C 省有业务,那么他或她被标记为局外人,但如果在 B 省有业务,他或她将是本地人。鉴于 OMB 在 我们的样本规模都很小,没有分支机构,每个业主只在一个省份开展业务。图 6 显示了 OMB 对本地人和外来者的经济活动的估计下降。外来者的经济活动下降幅度更大,在低谷期间,活跃商人的数量为 43%,销售额为反事实水平的 51%。在最糟糕的一周,活跃的外来者人数的降幅比活跃的本地人大 7 个百分点。我们发现,在 COVID-19 休息后的第十周,即复工一个月后,OMB 相对于他们的反事实的活动在外来者和当地人之间几乎处于相似水平,尽管活跃的外来者的数量仍远未达到 正常水平,反映了解除限制的积极影响,但农民工返乡相对滞后。


Part 5

结论和影响


我们建议,充分利用经济数字化和移动支付的普及,可以获得有关非正规经济的准确统计数据。利用中国最大的金融科技公司约 8000 万 OMB 的交易级业务数据和机器学习技术来预测 2020 年 OMB 活动的反事实路径,我们提供了受 COVID-19 打击后弱势非正式工人的第一视角 。中国数以千万计的 OMB 主要在经济的非正规服务部门工作,主要是在微型和家庭企业中,并雇用在 COVID-19 大流行期间大多无法在家工作的低技能工人。由于储蓄有限,许多 OMB 严重依赖现金流和短期贷款。如果他们不能长时间工作,整个家庭都会处于危险之中。需要有效的政策来缓解脆弱的 OMB 在零工经济中所感受到的痛苦,并减轻潜在的贫困和不平等影响。


我们发现,OMB 的数量和销售额立即急剧下降,每周最大的收缩幅度约为 50%,而由于锁定政策导致的下降幅度不大且可以忽略不计。城区OMB在低谷期间收缩幅度更大,最差一周活跃商户数量和成交额周均下降54%左右,而数量和成交额分别下降41%和43% ,分别为农村 OMB 的活跃商家。女性商家受到的打击比男性商家更大,在低谷期间,活跃商家数量和销售额的下降幅度分别比男性业主的下降幅度大 5% 和 9%。我们还看到,非出生在其开展业务的省份的企业主被严重扰乱,他们往往是没有社会保险的城市流动人口。简而言之,我们发现零工经济中最脆弱的工人受到了 COVID-19 大流行的沉重打击。因此,我们建议采取包容性政策应对措施,以减轻危机的影响并支持这一弱势群体。我们应该特别关注可能难以谋生的潜在城市贫困人口。


OMBs 的经济活动在 2 月整个月内直线下降,然后在 2 月底开始大幅反弹。在 COVID-19 爆发七周后,这些业务已反弹至应有的水平的 80% 左右,并在此水平上徘徊了三周,直到我们的样本期结束。自全国范围内鼓励复工以来,OMBs的快速恢复提供了优先控制病毒的必要性和政府支持重新开放经济的重要性的证据。尽管非正规企业规模小且脆弱,但一旦病毒的传播在很大程度上或完全得到控制,就有可能迅速复苏。然而,非正式工人的痛苦是真实的,我们看到了进一步反弹的瓶颈和不同群体的不平衡复苏。对整个弱势非正规工人,尤其是女性和移民群体的负面影响可能是长期的,因此我们建议采取更持续的政策应对措施,以确保在相对长期内为最弱势群体提供足够的支持 在疫情防控新常态下。


如果没有重要的政策支持,OMB 的快速复苏是不可能的。例如,截至 2020 年 2 月 12 日,中国至少有 25 个省份推出了多达 90 项支持中小企业的措施,其中提到最多的措施包括支持重新开放、延迟收费(电、 水、气)、滞纳金、减租减税、滞纳金或退还社保费,降低融资成本,加大融资支持力度。我们警告说,这些只是病毒爆发后几个月的短期反应和部分分析;然而,我们强调充分利用数字发展来衡量和跟踪非正规部门经济活动的重要性。


Part 6

附录A 数据聚合方式


我们的数据集中约有 8000 万线下微商 (OMB) 商家。考虑到数据隐私问题,我们将在适当的地理级别汇总 OMB 数据。基于行政单位、人口普查轨迹和其他既定区域的广泛使用的划分导致我们大样本中的大量信息丢失。例如,如果我们将 8000 万 OMB 商户分配到 2800 个县,那将是不幸的。所提出的聚合方法的一个原则是从尽可能低的地理水平开始,区域可以根据当地的商业活动进行适应性调整,即在人口密度和经济活动水平较高的地区密集分布地块,以及反之亦然。这避免了初始区域单元数量的大幅增加,如统一的小网格单元,并确保 OMB 的数量与每个区域的经济发展、人口和地理特征之间的关系更加密切。这在很大程度上确保了在粒度数据中保持信息。


我们建议创建泰森多边形并将 OMB 分配给每个多边形。泰森多边形,也称为 Voronoi 图,是分析邻近度和邻域的基本方法,例如通话时间转移和移动通信、警察执法和犯罪的空间分布、艾滋病毒感染的决定因素和交通事故 。该方法定义了一个围绕中心点的区域,其中每个位置都比其他位置更靠近该点。在我们的分析中,与到任何其他中心点的距离相比,属于特定泰森多边形的每个 OMB 离自己的中心点最近。描绘泰森多边形的一个关键是确定每个多边形的中心点。我们建议使用银行网点(包括自助网点)作为多边形的中心。一方面,银行分支机构的分布符合提出的聚集原则,即分支机构密集分布在业务和经济活跃的地区。另一方面,银行分支机构几乎覆盖了全国所有地方,鉴于金融服务在商业活动中的重要性,将银行分支机构作为数据聚合多边形的中心点是合理的。我们将每个 500 米网格单元内的银行分行合并为一个作为中心点,取其地理坐标的平均值,并在中国大陆的这些点周围建立 138,629 个多边形。图 A.1 显示了北京朝阳区被划分为 437 个多边形后的示意图,每个红点代表一个银行分行,线条代表多边形的边界。朝阳区为泰森多边形区域的灵活性提供了很好的可视化。具体来说,朝阳区的西部是商业区,著名的三里屯大街和中央商务区(CBD)就在这里。


CBD是北京最具活力的商业地段之一,众多中外企业总部选择落户于此。我们看到示意图西侧的多边形分布非常密集。朝阳区东部主要位于北京三环外,绿地公园较多,商业活动较少。示意图东边的多边形稀疏地分散。比较清楚地说明了泰森多边形在调整面积方面的优势汇总适应当地商业活动的个体样本。我们稍后在多边形级别聚合数百万个 OMB,并相应地匹配其他经济、人口和地理特征。


图A .1 北京朝阳区 泰森多边形


Part 7

附录B 数据描述


B.1 线下微商数据


表B.1




我们每周使用来自蚂蚁金服的大约 8000 万个二维码商户(或中文称“马商”)的数据,这些数据在泰森多边形级别汇总,时间为 2019 年 12 月 31 日至 2020 年 4 月 2 日,以及 2018 年和 2019 年相应的农历日期。中国最大的金融科技公司。表 B.1 显示了我们分析中时间窗口的全貌。
我们展示了关于二维码商家、采用数字支付解决方案的线下微型企业 (OMB) 的四个关键事实。首先,它们是线下微商,通过商户专用的支付宝二维码接受客户付款,包括在工商部门注册或未注册的企业。其次,他们大多是个体户和家族企业。商户二维码只能个人申请,法人不能申请,这与个体工商户难以区分业主和经营实体的特点不谋而合。这不包括我们样本中以公司名义经营和落户的大型企业,如大型超市、连锁店、饭店等。第三,它们主要是非常微型的企业。2019年99%的这些商户年均收入低于40万元(约合5.6万美元)。根据工信部的分类,年收入低于100万元的零售业务规模较小 企业。第四,它们在中国的 OMB 中具有相当的代表性。商户支付宝二维码是专门为OMB设计的,因为商户账户的提现费用低于个人账户,而且只需几分钟即可轻松申请账户和相关二维码。因此,OMB 有强烈的动机使用二维码解决方案来接受支付,特别是因为移动支付已成为大多数中国人日常交易的首选。
冠状病毒的总经济成本尚未显现,但显然 OMB 首当其冲地承受了与 COVID-19 抗争的封锁措施,它们主要在服务业,不能在家工作。在 1 月 20 日之前的两周内,在民众和政府对即将到来的疫情知之甚少的情况下,OMB 的销售营业额同比增长了 33.1%(同比)。
 随着病毒的迅速升级,2020 年 1 月 31 日(农历 1 月 7 日,农历新年后的第 7 天)后的两周内,OMB 的销量急剧下降,同比下降 39.4%。图 B.1 显示了农历新年假期前后两周 OMB 销售额的城市级同比变化。在全国范围内的病毒爆发中,很少有 OMB 能够免受重创。在内蒙古、青海、西藏、广西等西部省份,OMB的销售额似乎保持正增长;然而,与农历新年前两周高达80%至90%的增长相比,后病毒时期的销售额下降幅度很大。因此,对 OMB 的负面经济影响将比同比变化所显示的明显下降要严重得多,因为隐含销售额的增长路径比上一年要大得多。



图B.1 2020年OMB 销售营业额同比变化情况


B.2 汇总统计


我们收集了可能影响 OMB 活动的变量的栅格数据,例如经济发展、人口和地理特征。首先,我们将气象变量纳入分析。中国国家气象信息中心每天提供来自 800 多个气象站的温度、风速、气压、湿度和降水量。其次,我们在 2019 年 12 月从高德应用程序编程接口获得了 3500 万个兴趣点数据,涵盖 18 个主要类别。第三,我们拥有 500 米空间分辨率的栅格夜间灯光数据,人口数据为 1,000 米网格单元级别和 30 米网格单元级别的高程。我们进一步计算了多边形中心到各省县、地级市和省会城市的行驶距离,反映了多边形级别的交通便利。为了每周将这些变量与多边形级别的 OMB 活动合并,我们首先在每个多边形的分析窗口中计算每周变量的平均值,然后将变量与 OMB 活动的每周平均值进行匹配 基于多边形代码。表 B.2 展示了这些变量的每周汇总统计数据。我们将每年的样本分为两个时期:爆发前和爆发后时期。面板 A 报告了多边形级别的 OMB 活动和气象变量的汇总统计数据。相对前期,事件数据后的10周内,2018年活跃OMB数量下降11.28%,2019年下降10.38%,2020年下降33.20%,2018年销售额下降1.41%,  2019 年为 1.31%,2020 年为 3.35%。后病毒时期的总体下降反映了农历新年前后的季节性;但是,我们认为 2020 年 OMB 的活动下降幅度相对较大。自疫情爆发以来的 10 周期间,OMB 活动相对于病毒前时期的平均收缩并不能直接告诉我们大流行的因果影响;为此,我们将每周探讨 OMB 在后病毒时期活动的因果崩溃。


表B.2 总结数据


Part 8

附录C. 基于梯度提升决策树的预测


在本节中,我们将阐明反事实路径上的预测细节。梯度提升决策树 (GBDT) 最早由 Friedman (2001) 提出,是机器学习的典型算法之一 ,具有广泛的学术应用。它最近得到了广泛的应用,主要是由于其高精度和快速的训练和预测速度。以下是在预测 OMB 活动的过程中值得注意的三个细节。首先,我们在 2019 年在泰森多边形级别训练 GBDT 模型。我们预测病毒后 10 周时间窗口内活跃 OMB 的每周数量和销售量;因此,我们需要每周为每个响应变量训练总共 20 个(=10 * 2)个模型,特征变量列表包括 56 个变量。其次,选择数据集的 10% 作为测试集,然后我们将剩余的数据分成五组,在选择优化的超参数之前,通过五折交叉验证对模型进行优化。接下来,根据优化后的参数,建立OMBs活动预测模型,并对测试集进行预测分析。我们通过计算模型从未见过的测试集上的系数 R2 来评估模型的泛化能力,并将算法的预测值解释为 OMB 的目标数量和销售额。R2越大,OMBs活动的预测准确率越高,泛化能力越强。预测 OMB 活动的模型的 R2 高于 0.90。最后,我们使用 2018 年和 2019 年的整个数据集更新选定的超参数集,并根据最终更新的参数建立 2020 年病毒后反事实路径的预测模型。有关模型的超参数和性能的更多详细信息,请参见表 C.1 和 C.2。

表C.1  GBDT模型的超参数集


表C.2 GBDT模型的表现









请后台回复“COVID-19 大流行期间的非正规经济

END

/李彦洁

编辑/李彦洁

责编/孙翼



【延伸阅读】




   

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存