查看原文
其他

Stata:logistic 回归模型中的 ROC 与 AUC-lroc

连享会 连享会 2022-12-31

👇 连享会 · 推文导航 | www.lianxh.cn

🎦 效率分析前沿模型 最新模型和工具
📅 2021 年 11 月 13-14;20-21 日
🔑 张宁教授 (山东大学);杜克锐副教授 (厦门大学)
🍓 课程主页https://gitee.com/lianxh/TE

实现经济增长的途径主要有两个:一是增加投入,二是提高效率。后者不仅能增加经济总量,还能提升经济质量。因此,效率分析是经济学研究中的核心。

显然,若想发表高水平的论文,就必须紧跟前沿,引领趋势,这正是本期「效率分析前沿模型」课程的主旨。

张宁教授在环境效率和非期望产出领域学者中排名第二,他在 Science, Nature, Cell 和 Lancet 上均有发表。杜克锐副教授已在 SSC 发布了十余个 Stata 命令,有三篇论文发表于 Stata Journal,获得 2020 年 Stata 中国用户奖。

课程包括参数方法和非参数方法两个部分:

  • 参数方法主要包括参数线性规划(Parametric LP)、计量经济方法和随机前沿方法(SFA)三大方法。
  • 非参数方法,即 DEA 方法,主要包括 DDF, NDDF 和 SBM 等模型。


重要福利: 本课程所涉及的参数和非参数效率模型,老师们都将会提供封装后的 Stata 估计命令,只需几条简单的命令即可实现最新的模型。老师们也会分享编写过程心得,让大家有能力对这些封装程序进行修改和扩展。

扫码直达课程主页:


作者:Bethune 学院
邮箱:bethune0507@163.com


目录

  • 1. 单个试验与联合试验

  • 2. 单个试验与 logistics 回归模型

  • 3. 单个模型的 ROC

  • 4. 两个模型的 ROC

  • 5. 参考资料

  • 6. 相关推文



温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:

1. 单个试验与联合试验

由于一个指标的诊断实验很难使灵敏度和特异度都变的很高,因此可以采用多个指标联合起来,进行诊断实验。联合试验可以分为两种类型:平行试验与系列试验。

由上图可知,为了排除某病,而缺乏灵敏度高的诊断方法时可采用平行试验,以提高灵敏度。为了确诊某病,在缺乏特异性高的诊断试验时,可采用系列试验,以提高特异度。

2. 单个试验与 logistics 回归模型

第一部分是两个指标的联合试验,当涉及更多个指标时,分类情况变得更为复杂。因此可以使用 logistics 回归模型,通过形成的预测概率或联合预测因子为分析指标,建立 ROC 曲线。该方法能将多指标综合为一个指标,从而实现了降维目的,尤其适用于有协变量或多指标联合诊断试验的分析评价。

logistic 回归模型在 ROC 曲线中的应用,考虑了混杂因素对疾病状态的影响,更注重诊断体系在医疗实践中的价值。也就是说,不单所评价指标对疾病有影响,其他诸如本研究中的年龄、性别、是否吸烟等因素的分布情况亦对疾病的发生起着重要作用,故将这些测量指标纳入对疾病产生影响的向量矩阵中。通过建立模型得到联合分布概率或联合预测因子,使其尽可能地更接近于总体的实际情况再进行评价。

3. 单个模型的 ROC

在 Stata 中,使用 lroc 命令在进行 logit 或 logistic 后,很容易获得 ROC 曲线下的面积。

. use "https://stats.idre.ucla.edu/stat/stata/notes/hsb2.dta", clear
. generate hon=write>=60 //create binary response variable
. logit hon female, nolog
Logistic regression Number of obs = 200
LR chi2(1) = 3.94
Prob > chi2 = 0.0473
Log likelihood = -113.6769 Pseudo R2 = 0.0170
------------------------------------------------------------------------------
hon | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
female | 0.651 0.334 1.95 0.051 -0.003 1.305
_cons | -1.400 0.263 -5.32 0.000 -1.916 -0.884
------------------------------------------------------------------------------

. lroc
Logistic model for hon
Number of observations = 200
Area under ROC curve = 0.5785

. predict xb1, xb //create linear predictor for model 1

4. 两个模型的 ROC

重复上述命令,得到第二个模型的 AUC 面积为  0.8330。

. logit hon female read, nolog

Logistic regression Number of obs = 200
LR chi2(2) = 60.40
Prob > chi2 = 0.0000
Log likelihood = -85.44372 Pseudo R2 = 0.2612
------------------------------------------------------------------------------
hon | Coefficient Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
female | 1.121 0.408 2.75 0.006 0.321 1.921
read | 0.144 0.023 6.19 0.000 0.099 0.190
_cons | -9.603 1.426 -6.73 0.000 -12.399 -6.808
------------------------------------------------------------------------------

. lroc
Logistic model for hon
Number of observations = 200
Area under ROC curve = 0.8330

. predict xb2, xb // create linear predictor for model 2

我们运行了两种不同的模型,并且ROC曲线下的面积为 0.578 和 0.8330。接下来,我们将使用带有 roccomp 命令的两个线性预测变量来测试 ROC 曲线下面积的差异。

. roccomp hon xb1 xb2, graph summary

ROC Asymptotic normal
Obs area Std. err. [95% conf. interval]
-------------------------------------------------------------------------
xb1 200 0.5785 0.0388 0.50242 0.65456
xb2 200 0.8330 0.0301 0.77397 0.89205
-------------------------------------------------------------------------
H0: area(xb1) = area(xb2)
chi2(1) = 34.91 Prob>chi2 = 0.0000

5. 参考资料

  • HOW CAN I TEST THE DIFFERENCE IN AREA UNDER ROC CURVE FOR TWO LOGISTIC REGRESSION MODELS -Link-
  • 陈卫中, 潘晓平, 倪宗瓒. logistic 回归模型在 ROC 分析中的应用[J]. 中国卫生统计, 2007, 24(1): 22-24. -Link-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh logit, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:Stata命令
    • Stata新命令:面板-LogitFE-ProbitFE
  • 专题:交乘项-调节
    • Logit-Probit中的交乘项及边际效应图示
  • 专题:Probit-Logit
    • Stata:面板混合选择模型-cmxtmixlogit
    • Logit-Probit:非线性模型中交互项的边际效应解读
    • 秒懂小罗肥归:logit与mlogit详解
    • reg2logit:用OLS估计Logit模型参数
    • feologit:固定效应有序Logit模型
    • Stata:多元 Logit 模型详解 (mlogit)
    • Stata:Logit模型一文读懂
    • 详解 Logit/Probit 模型中的 completely determined 问题
    • Stata:Logit 模型评介
    • 二元选择模型:Probit 还是 Logit?
    • Stata:何时使用线性概率模型而非Logit?
    • Stata:嵌套 Logit 模型 (Nested Logit)

New! Stata 搜索神器:lianxhsongbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉  使用:
. lianxh DID 倍分法
. songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下:连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存