沙龙回顾 | 陈松蹊:去除数据中的混杂偏差——从女士品茶到大气污染评估
2020年10月18日上午,北京大学光华管理学院2020级商业分析硕士班学术沙龙委员会举办了秋季学期第三期沙龙活动,活动邀请到北大光华商务统计与经济计量系联合系主任陈松蹊教授,陈老师本期分享的主题为:去除数据中的混杂偏差——从女士品茶到大气污染评估。
随着环境大数据时代的到来,利用大气监测网络数据和大数据统计方法度量大气治理效果的重要性日益显现。陈松蹊教授以此为例,介绍了如何去除数据中的混杂偏差。以下是陈松蹊教授的具体分享内容:
首先,陈松蹊教授指出,大气污染的管理和治理主要是对污染物排放的管理,因此需要对污染排放量进行度量。但是目前的大气污染度量和评估常用方法在研究中国污染问题上存在局限性,而随着大数据时代的到来,使用统计学方法更加科学地度量污染排放量将是更优的选择。
其次,陈松蹊教授介绍了“充分随机实验”和“观测研究”两种获得处理效应的统计方法:充分随机实验可以充分去除数据中的混杂偏差,获得准确的处理效应,而观测研究易受到混杂偏差的影响,因此需要构造统计学方法去除或减少这一干扰。陈松蹊教授还通过“女士品茶”、美国大选、吸烟对健康的影响等案例,进一步说明混杂偏差对于获得处理效应的干扰。
最后,陈松蹊教授提出了一个在基准气象分布下重新计算污染物浓度的方法,以消除混杂因素的干扰,准确刻画污染的排放程度。同时,他提出评估一个城市污染治理的“人努力-天帮忙”指数。这一指数对量化大气污染数据中人为减排的效果和天气干扰的影响十分有效。
陈松蹊,北京大学讲席教授,商务统计与经济计量系联合系主任、北京大学统计科学中心创始主任。数理统计学会资深会员,美国统计学会会士,国际统计学会当选会员,任《Environmentrics》、《Journal of the American Statistial Association》等多本学术杂志编委。主要研究领域包括环境统计、大气污染数据分析,经济、金融计量学,风险度量,统计学在人口普查中的应用,随机过程统计推断,高维数据分析,抽样方法等。
持续关注北大光华商业分析
第一时间掌握项目信息