Stata:logistic 回归模型中的 ROC 与 AUC-lroc
👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:公开课-直播 | 计量专题 | 关于连享会
🎦 效率分析前沿模型 最新模型和工具
📅 2021 年 11 月 13-14;20-21 日
🔑 张宁教授 (山东大学);杜克锐副教授 (厦门大学)
🍓 课程主页:https://gitee.com/lianxh/TE
实现经济增长的途径主要有两个:一是增加投入,二是提高效率。后者不仅能增加经济总量,还能提升经济质量。因此,效率分析是经济学研究中的核心。
显然,若想发表高水平的论文,就必须紧跟前沿,引领趋势,这正是本期「效率分析前沿模型」课程的主旨。
张宁教授在环境效率和非期望产出领域学者中排名第二,他在 Science, Nature, Cell 和 Lancet 上均有发表。杜克锐副教授已在 SSC 发布了十余个 Stata 命令,有三篇论文发表于 Stata Journal,获得 2020 年 Stata 中国用户奖。
课程包括参数方法和非参数方法两个部分:
参数方法主要包括参数线性规划(Parametric LP)、计量经济方法和随机前沿方法(SFA)三大方法。 非参数方法,即 DEA 方法,主要包括 DDF, NDDF 和 SBM 等模型。
重要福利: 本课程所涉及的参数和非参数效率模型,老师们都将会提供封装后的 Stata 估计命令,只需几条简单的命令即可实现最新的模型。老师们也会分享编写过程心得,让大家有能力对这些封装程序进行修改和扩展。
扫码直达课程主页:
作者:Bethune 学院
邮箱:bethune0507@163.com
目录
1. 单个试验与联合试验
2. 单个试验与 logistics 回归模型
3. 单个模型的 ROC
4. 两个模型的 ROC
5. 参考资料
6. 相关推文
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
1. 单个试验与联合试验
由于一个指标的诊断实验很难使灵敏度和特异度都变的很高,因此可以采用多个指标联合起来,进行诊断实验。联合试验可以分为两种类型:平行试验与系列试验。
由上图可知,为了排除某病,而缺乏灵敏度高的诊断方法时可采用平行试验,以提高灵敏度。为了确诊某病,在缺乏特异性高的诊断试验时,可采用系列试验,以提高特异度。
2. 单个试验与 logistics 回归模型
第一部分是两个指标的联合试验,当涉及更多个指标时,分类情况变得更为复杂。因此可以使用 logistics 回归模型,通过形成的预测概率或联合预测因子为分析指标,建立 ROC 曲线。该方法能将多指标综合为一个指标,从而实现了降维目的,尤其适用于有协变量或多指标联合诊断试验的分析评价。
logistic 回归模型在 ROC 曲线中的应用,考虑了混杂因素对疾病状态的影响,更注重诊断体系在医疗实践中的价值。也就是说,不单所评价指标对疾病有影响,其他诸如本研究中的年龄、性别、是否吸烟等因素的分布情况亦对疾病的发生起着重要作用,故将这些测量指标纳入对疾病产生影响的向量矩阵中。通过建立模型得到联合分布概率或联合预测因子,使其尽可能地更接近于总体的实际情况再进行评价。
3. 单个模型的 ROC
在 Stata 中,使用 lroc
命令在进行 logit 或 logistic 后,很容易获得 ROC 曲线下的面积。
. use "https://stats.idre.ucla.edu/stat/stata/notes/hsb2.dta", clear
. generate hon=write>=60 //create binary response variable
. logit hon female, nolog
Logistic regression Number of obs = 200
LR chi2(1) = 3.94
Prob > chi2 = 0.0473
Log likelihood = -113.6769 Pseudo R2 = 0.0170
------------------------------------------------------------------------------
hon | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
female | 0.651 0.334 1.95 0.051 -0.003 1.305
_cons | -1.400 0.263 -5.32 0.000 -1.916 -0.884
------------------------------------------------------------------------------
. lroc
Logistic model for hon
Number of observations = 200
Area under ROC curve = 0.5785
. predict xb1, xb //create linear predictor for model 1
4. 两个模型的 ROC
重复上述命令,得到第二个模型的 AUC 面积为 0.8330。
. logit hon female read, nolog
Logistic regression Number of obs = 200
LR chi2(2) = 60.40
Prob > chi2 = 0.0000
Log likelihood = -85.44372 Pseudo R2 = 0.2612
------------------------------------------------------------------------------
hon | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
female | 1.121 0.408 2.75 0.006 0.321 1.921
read | 0.144 0.023 6.19 0.000 0.099 0.190
_cons | -9.603 1.426 -6.73 0.000 -12.399 -6.808
------------------------------------------------------------------------------
. lroc
Logistic model for hon
Number of observations = 200
Area under ROC curve = 0.8330
. predict xb2, xb // create linear predictor for model 2
我们运行了两种不同的模型,并且ROC曲线下的面积为 0.578 和 0.8330。接下来,我们将使用带有 roccomp
命令的两个线性预测变量来测试 ROC 曲线下面积的差异。
. roccomp hon xb1 xb2, graph summary
ROC Asymptotic normal
Obs area Std. err. [95% conf. interval]
-------------------------------------------------------------------------
xb1 200 0.5785 0.0388 0.50242 0.65456
xb2 200 0.8330 0.0301 0.77397 0.89205
-------------------------------------------------------------------------
H0: area(xb1) = area(xb2)
chi2(1) = 34.91 Prob>chi2 = 0.0000
5. 参考资料
HOW CAN I TEST THE DIFFERENCE IN AREA UNDER ROC CURVE FOR TWO LOGISTIC REGRESSION MODELS -Link- 陈卫中, 潘晓平, 倪宗瓒. logistic 回归模型在 ROC 分析中的应用[J]. 中国卫生统计, 2007, 24(1): 22-24. -Link-
6. 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh logit, m
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:Stata命令 Stata新命令:面板-LogitFE-ProbitFE 专题:交乘项-调节 Logit-Probit中的交乘项及边际效应图示 专题:Probit-Logit Stata:面板混合选择模型-cmxtmixlogit Logit-Probit:非线性模型中交互项的边际效应解读 秒懂小罗肥归:logit与mlogit详解 reg2logit:用OLS估计Logit模型参数 feologit:固定效应有序Logit模型 Stata:多元 Logit 模型详解 (mlogit) Stata:Logit模型一文读懂 详解 Logit/Probit 模型中的 completely determined 问题 Stata:Logit 模型评介 二元选择模型:Probit 还是 Logit? Stata:何时使用线性概率模型而非Logit? Stata:嵌套 Logit 模型 (Nested Logit)
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下:连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。