三农学术周报(第71期)| 本周数据分享及经管必备方法整理
启研学社由知名学者担任学术顾问,由高校师生与企研数据科学团队联合组建的,是以大数据资源及相关技术助力中国学术、智库与行业研究为宗旨的研究组织。团队当前的主要目标是挖掘行政、经济与社会大数据资源在经济学学术、智库与相关行业研究领域中的应用价值,以学术研究为标准开展大数据治理研究,努力探索大数据分析技术融入中国经济社会研究的可行进路。
三农大数据·交流社群旨在为三农相关领域学者提供一个交流学习的平台,群内定期分享三农领域前沿资讯。
长按扫描二维码,获取周报全集
本文由三农大数据整理,如需转载,请注明来源。人工整理,如有疏漏,欢迎指正!
数据资源
企研大数据
目前网页版的CPPGD中,如下图所示,该子库以分省的形式呈现,具体包含河北省、江西省、湖南省等22个省份,主要包括企业基本信息表、企业自动监测表、企业手动监测表、企业未检测原因表、企业年度报告表等93张表格。
中国经济普查年鉴
关注我们,公众号对话框内发送关键词“0061” 。
注:本资源来源于网络,请各位自行辨别,谨慎使用!
中国环境统计年鉴(1998-2021)
关注我们,公众号对话框内发送关键词“0062” 。
注:本资源来源于网络,请各位自行辨别,谨慎使用!
方法园地
数据seminar
之前的文章中,我们详细地介绍了使用 Pandas 绘制柱状图和折线图的方法,仅使用一两行核心代码就可以绘制一个精美的柱状图或者折线图。为了呈现各种各样的数据分布,数据分析图形也变得十分多样化,本期文章我们将会介绍另外两种常见的数据可视化图形——饼图和散点图。
2.2 使用随机分配解决选择性问题
启研Economics
中微笔记 | 为什么短期平均成本曲线并不总是在其最低点与长期平均成本曲线相切?
最后,如上图所示,如果不是规模报酬不变,当然就不是相切于每一条短期平均成本曲线的最低点了。
中微笔记|如何理解图22.8中长期平均成本曲线先下降后上升?
先来看长期总成本曲线,根据定义,长期总成本曲线的斜率,其实就是长期边际成本。上图的panel e中,长期边际成本是先下降后上升。再来看对应的长期平均成本曲线,在产出水平降低时,长期平均成本下降,那就意味着通过增加投入来提高产出时,产出的提高比例高于成本提高的比例,在要素价格外生给定的情况下,也就是产出提高比例高于要素投入数量提高的比例,这就是规模报酬递增;随着产出水平的上升,长期平均成本开始上升,这次情况刚好相反,那么对应就是规模报酬递减的情况。
数量经济学
本文利用面板数据提出了一个新的因果效应估计,该估计建立在广泛使用的双重差分和合成控制方法的见解之上。相对于这些方法,研究发现,无论是从理论上还是从经验上来说,这种“系统双重差分方法”估计具有理想的稳健性,并且它在传统估计中通常在实践中使用的环境中表现良好。本文研究了当结果模型的系统部分包括潜在的单位因素与潜在的时间因素相互作用时估计量的渐近行为,并给出了一致性和渐近正态性的条件。
Stata and Python数据分析
我们使用Stata处理数据时,第一步需要将数据读入,当我们遇到的数据为dta格式时,我们可以使用use/sysuse命令来直接进行读入;当我们遇到Excel文件时应当如何操作呢下面我们学习如何将Excel文件读入到Stata中!
下面我们分别以列表(list)和元组(tuple)为例,直观呈现可变对象与不可变对象的区别。
Python大数据分析
Matplotlib提供了几十种图表样式,满足了不同场景和需求,比如论文用图、会议用图、报告用图等。我这里选了9种比较喜欢的分享出来,希望能帮助到需要的小伙伴。
而今天的文章费老师我就来带大家学习如何利用
joblib
这个非常简单易用的库中的相关功能,来快速实现并行计算加速效果。
刘西川阅读写作课
今年的评议让我对科学问题属性及其阐述有了更多、更深入的思考,现将自己的认识体会记录如下。
写综述,对很多年轻朋友来讲,是一件比较痛苦或困难的事情:要么是不知道如何操作,想出力却又不知道力气该用到哪里;要么是忙活了半天,累得满头大汗,忙完提交给老师后,老师认为就是罗列,没有达到综述的目的。在这个方面,可以将初学者面临的困境概括为两个“痛点”:痛点一是是抓不住目标,文献综述的目标是发现和提出问题。痛点二是分析不够,没有抓住分析的焦点是已有研究的分歧点及改善思路,即未能围绕猜想和假说展开比较和验证。
连享会
在论文写作中,图形在呈现研究数据方面起着关键的作用,并有助于验证数据分析的结果。然而,图形可能有时绘制不当,无法准确表达作者的观点,因此需要在发表之前进行反复修改。为此,本文将通过对 Rice 等 (2015) 的介绍,来帮助大家更好理解 Stata 绘图以及实证写作。
社会网络图是对网络关系的图示形式,节点间有联系则为 1 (有线条),无联系则为 0 (无线条)。一些文章中也使用社会网络图表示特定的关系,如以线条的粗细表现权重,节点大小和颜色表示某些属性等。因此,美观又承载多种信息的社会网络图可以为文章添色。本篇文章主要讲述如何用 R 画出具有更多信息的社会网络图。
在本文中,我们简要介绍了中介效应分析的设计、存在问题、以及改进建议。关于中介效应是否在经济学研究中适用,大家也可以参考知乎热议「三段式中介效应模型真的适用于经济学研究吗?还可以用什么方法来检验影响机制?」。
Stata数据处理:将字符变量编码为数值变量-encoder
encode 命令 sencode 命令 encoder 命令和 encoderall 命令 相关推文
桑基图最明显的特征就是,始末端的分支宽度总和相等,即所有主支宽度的总和应与所有分出去的分支宽度的总和相等,保持能量平衡。本文将着重分享使用 Stata 中的
sankey_plot
命令来制作桑基图的过程。
制作表格是研究人员最常见的任务之一。在本文中,我们将介绍如何通过 esttab 命令输出LaTeX表格。esttab 命令是由瑞士波恩大学社会学研究所的 Ben Jann 教授编写,被广泛应用于 Stata 的结果输出。
加入三农大数据·交流学习群,获取更多三农相关新鲜资讯
END
点亮特关小星星
搜索你感兴趣的文章吧