Stata：logistic 回归模型中的 ROC 与 AUC-lroc

Original 连享会连享会 2022-12-31

收录于合集

👇 连享会 · 推文导航 | www.lianxh.cn

🍎 Stata：Stata基础 | Stata绘图 | Stata程序 | Stata新命令
📘 论文：数据处理 | 结果输出 | 论文写作 | 数据分享
💹 计量：回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归
⛳ 专题：SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析
🔃 因果：DID | RDD | 因果推断 | 合成控制法 | PSM-Matching
🔨 工具：工具软件 | Markdown | Python-R-Stata
🎧 课程：公开课-直播 | 计量专题 | 关于连享会

🎦 效率分析前沿模型 最新模型和工具
📅 2021 年 11 月 13-14；20-21 日
🔑 张宁教授 (山东大学)；杜克锐副教授 (厦门大学)
🍓 课程主页：https://gitee.com/lianxh/TE

实现经济增长的途径主要有两个：一是增加投入，二是提高效率。后者不仅能增加经济总量，还能提升经济质量。因此，效率分析是经济学研究中的核心。

显然，若想发表高水平的论文，就必须紧跟前沿，引领趋势，这正是本期「效率分析前沿模型」课程的主旨。

张宁教授在环境效率和非期望产出领域学者中排名第二，他在 Science, Nature, Cell 和 Lancet 上均有发表。杜克锐副教授已在 SSC 发布了十余个 Stata 命令，有三篇论文发表于 Stata Journal，获得 2020 年 Stata 中国用户奖。

课程包括参数方法和非参数方法两个部分：

参数方法主要包括参数线性规划（Parametric LP）、计量经济方法和随机前沿方法（SFA）三大方法。
非参数方法，即 DEA 方法，主要包括 DDF, NDDF 和 SBM 等模型。

重要福利： 本课程所涉及的参数和非参数效率模型，老师们都将会提供封装后的 Stata 估计命令，只需几条简单的命令即可实现最新的模型。老师们也会分享编写过程心得，让大家有能力对这些封装程序进行修改和扩展。

扫码直达课程主页：

作者：Bethune 学院
邮箱：bethune0507@163.com

1. 单个试验与联合试验
2. 单个试验与 logistics 回归模型
3. 单个模型的 ROC
4. 两个模型的 ROC
5. 参考资料
6. 相关推文

温馨提示： 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码，直达原文：

1. 单个试验与联合试验

由于一个指标的诊断实验很难使灵敏度和特异度都变的很高，因此可以采用多个指标联合起来，进行诊断实验。联合试验可以分为两种类型：平行试验与系列试验。

由上图可知，为了排除某病，而缺乏灵敏度高的诊断方法时可采用平行试验，以提高灵敏度。为了确诊某病，在缺乏特异性高的诊断试验时，可采用系列试验，以提高特异度。

2. 单个试验与 logistics 回归模型

第一部分是两个指标的联合试验，当涉及更多个指标时，分类情况变得更为复杂。因此可以使用 logistics 回归模型，通过形成的预测概率或联合预测因子为分析指标，建立 ROC 曲线。该方法能将多指标综合为一个指标，从而实现了降维目的，尤其适用于有协变量或多指标联合诊断试验的分析评价。

logistic 回归模型在 ROC 曲线中的应用，考虑了混杂因素对疾病状态的影响，更注重诊断体系在医疗实践中的价值。也就是说，不单所评价指标对疾病有影响，其他诸如本研究中的年龄、性别、是否吸烟等因素的分布情况亦对疾病的发生起着重要作用，故将这些测量指标纳入对疾病产生影响的向量矩阵中。通过建立模型得到联合分布概率或联合预测因子，使其尽可能地更接近于总体的实际情况再进行评价。

3. 单个模型的 ROC

在 Stata 中，使用 lroc 命令在进行 logit 或 logistic 后，很容易获得 ROC 曲线下的面积。

. use "https://stats.idre.ucla.edu/stat/stata/notes/hsb2.dta", clear
. generate hon=write>=60  //create binary response variable
. logit hon female, nolog
Logistic regression                                     Number of obs =    200
                                                        LR chi2(1)    =   3.94
                                                        Prob > chi2   = 0.0473
Log likelihood = -113.6769                              Pseudo R2     = 0.0170
------------------------------------------------------------------------------
         hon | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
      female |      0.651      0.334     1.95   0.051       -0.003       1.305
       _cons |     -1.400      0.263    -5.32   0.000       -1.916      -0.884
------------------------------------------------------------------------------

. lroc
Logistic model for hon
Number of observations =      200
Area under ROC curve   =   0.5785

. predict xb1, xb  //create linear predictor for model 1

4. 两个模型的 ROC

重复上述命令，得到第二个模型的 AUC 面积为 0.8330。

. logit hon female read, nolog

Logistic regression                                     Number of obs =    200
                                                        LR chi2(2)    =  60.40
                                                        Prob > chi2   = 0.0000
Log likelihood = -85.44372                              Pseudo R2     = 0.2612
------------------------------------------------------------------------------
         hon | Coefficient  Std. err.      z    P>|z|     [95% conf. interval]
-------------+----------------------------------------------------------------
      female |      1.121      0.408     2.75   0.006        0.321       1.921
        read |      0.144      0.023     6.19   0.000        0.099       0.190
       _cons |     -9.603      1.426    -6.73   0.000      -12.399      -6.808
------------------------------------------------------------------------------

. lroc
Logistic model for hon
Number of observations =      200
Area under ROC curve   =   0.8330

. predict xb2, xb  // create linear predictor for model 2

我们运行了两种不同的模型，并且ROC曲线下的面积为 0.578 和 0.8330。接下来，我们将使用带有 roccomp 命令的两个线性预测变量来测试 ROC 曲线下面积的差异。

. roccomp hon xb1 xb2, graph summary

                              ROC                     Asymptotic normal
                   Obs       area     Std. err.      [95% conf. interval]
-------------------------------------------------------------------------
xb1                200     0.5785       0.0388        0.50242     0.65456
xb2                200     0.8330       0.0301        0.77397     0.89205
-------------------------------------------------------------------------
H0: area(xb1) = area(xb2)
    chi2(1) =    34.91       Prob>chi2 =   0.0000

5. 参考资料

HOW CAN I TEST THE DIFFERENCE IN AREA UNDER ROC CURVE FOR TWO LOGISTIC REGRESSION MODELS -Link-
陈卫中, 潘晓平, 倪宗瓒. logistic 回归模型在 ROC 分析中的应用[J]. 中国卫生统计, 2007, 24(1): 22-24. -Link-

6. 相关推文

Note：产生如下推文列表的 Stata 命令为：
lianxh logit, m
安装最新版 lianxh 命令：
ssc install lianxh, replace

专题：Stata命令

Stata新命令：面板-LogitFE-ProbitFE

专题：交乘项-调节

Logit-Probit中的交乘项及边际效应图示

专题：Probit-Logit

Stata：面板混合选择模型-cmxtmixlogit
Logit-Probit：非线性模型中交互项的边际效应解读
秒懂小罗肥归：logit与mlogit详解
reg2logit：用OLS估计Logit模型参数
feologit：固定效应有序Logit模型
Stata：多元 Logit 模型详解 (mlogit)
Stata：Logit模型一文读懂
详解 Logit/Probit 模型中的 completely determined 问题
Stata：Logit 模型评介
二元选择模型：Probit 还是 Logit？
Stata：何时使用线性概率模型而非Logit？
Stata：嵌套 Logit 模型 (Nested Logit)

New！ Stata 搜索神器：lianxh 和 songbl GIF 动图介绍
搜：推文、数据分享、期刊论文、重现代码 ……
👉 安装：
. ssc install lianxh
. ssc install songbl
👉 使用：
. lianxh DID 倍分法
. songbl all

🍏 关于我们

连享会 ( www.lianxh.cn，推文列表) 由中山大学连玉君老师团队创办，定期分享实证分析经验。
直通车： 👉【百度一下：连享会】即可直达连享会主页。亦可进一步添加「知乎」,「b 站」,「面板数据」,「公开课」等关键词细化搜索。

市管干部“龚书记”免职迷局

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

法明传[2024]173号：关于加快推进起诉状、答辩状示范文本全面应用工作的通知(附下载链接)

Stata：logistic 回归模型中的 ROC 与 AUC-lroc

1. 单个试验与联合试验

2. 单个试验与 logistics 回归模型

3. 单个模型的 ROC

4. 两个模型的 ROC

5. 参考资料

6. 相关推文

🍏 关于我们

您可能也对以下帖子感兴趣

市管干部“龚书记”免职迷局

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

2025.1.1起，全国法院全面推进应用民事起诉状、答辩状示范文本(附下载链接)

法明传[2024]173号：关于加快推进起诉状、答辩状示范文本全面应用工作的通知(附下载链接)

生成图片，分享到微信朋友圈

Stata：logistic 回归模型中的 ROC 与 AUC-lroc

1. 单个试验与联合试验

2. 单个试验与 logistics 回归模型

3. 单个模型的 ROC

4. 两个模型的 ROC

5. 参考资料

6. 相关推文

🍏 关于我们

您可能也对以下帖子感兴趣