查看原文
其他

Stata:史上最全t-test检验-tost

连享会 连享会 2023-10-24

👇 连享会 · 推文导航 | www.lianxh.cn

连享会 · 2022空间计量专题

编译:姜昊 (华东师范大学)
邮箱:HaoJiang0204@outlook.com

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:


目录

  • 1. 理论介绍

  • 2. 命令介绍

    • 2.1 命令安装

    • 2.2 命令语法

  • 3. 案例介绍

    • 3.1 tostt 命令应用实例

    • 3.2 tostpr 命令应用实例

    • 3.3 tostsignrank 命令应用实例

  • 4. 相关推文



1. 理论介绍

tost 软件包提供了一套命令,包括 ttestttestiprtestprestimccmcciregresssignrankranksum 等。这些命令主要用于差异检验对应的两个单侧等值检验,从而解决一些配对和非配对、参数和非参数研究中的等值推断问题。

上述命令都将检验一个原假设,同时样本是从加减一些容忍度的不同总体中抽取。容忍度不仅可以用数据单位或等级单位 () 来定义,也可以 (除 tostrrptostrrpi 命令外) 用测试统计的分布单位 () 来定义。上述检验都是等值性检验,均或多或少的借鉴 Schuirmann (1987) 制定的 检验。

tost 软件包提供的所有命令都是基于 类型的检验,即样本统计数据的差异除以该差异的标准差:。其中, 代表统计差异, 代表差异的标准差。等值性检验的一般检验采用以下两种形式之一,这取决于等值性差异的定义方法,即是用 定义,还是 定义的。

第一种,用 定义:

  • Ho:

将绝对值符号打开,可以转化为下面两个单侧原假设:

  • Ho1:
  • Ho2:

当区间并非对称时,原假设变为:

  • Ho:,或者

将上式转化为下面两个单侧原假设:

  • Ho1:
  • Ho2:

第二种,用 定义:

  • Ho:

将绝对值符号打开,可以转化为下面两个单侧原假设:

  • Ho1:
  • Ho2:

当区间并非对称时,原假设变为:

  • Ho:,或者

将上式转化为下面两个单侧原假设:

  • Ho1:
  • Ho2:

2. 命令介绍

2.1 命令安装

* 命令安装
net install tost.pkg, replace

tost 包含的命令如下:

  • tostt:均值等价 检验;
  • tostpr:比例等价 检验;
  • tostsignrank:检验配对或匹配数据的分布是否等同于一个以零为中心的对称分布;
  • tostranksum:随机等价的双样本秩和检验;
  • tostmcc:二元数据中随机等价的配对 检验;
  • tostregress:等价性的线性回归检验;
  • tostrrp:配对设计中相对风险的等价性检验。

上述命令对应的即时命令:

  • tostti:均值等价 检验的即时命令,与 tostt 对应;
  • tostpri:比例等价 检验的即时命令,与 tostpr 对应;
  • tostmcci:二元数据中随机等价的配对 检验即时命令,与 tostmcc 对应;
  • tostrrpi:配对设计中相对风险的等价性检验的即时命令,与 tostrrp 对应。

关于即使命令 (Immediate Commands),是指不依赖与内存数据集,而是依赖于直接输入的数字的一组命令,此时 Stata 类似于计算机功能,详见 help immed

2.2 命令语法

2.2.1 tostt 命令

* 单样本均值等值 t 检验
tostt varname == # [if] [in] [, eqvtype(type) eqvlevel(#)
uppereqvlevel(#) alpha(#)]

* 非配对双样本均值等值 t 检验
tostt varname1 == varname2 [if] [in], unpaired [eqvtype(type)
eqvlevel(#) uppereqvlevel(#) unequal welch alpha(#)]

* 配对双样本均值等值 t 检验
tostt varname1 == varname2 [if] [in] [, eqvtype(type) eqvlevel(#)
uppereqvlevel(#) alpha(#)]

* 双组非配对均值等值 t 检验
tostt varname [if] [in], by(groupvar) [eqvtype(type) eqvlevel(#)
uppereqvlevel(#) unequal welch alpha(#)]

上述命令中选项的含义:

  • eqvtype(string):指定等值阈值类型,包括 deltaepsilon 两种;
  • eqvlevel(#):指定等值区间的容忍度水平;
  • uppereqvlevel(#):指定对称等值区间的上限水平;
  • uunpaired:指定数据是非配对样本;
  • by(groupvar):分组变量 (意味着样本为非配对样本);
  • unequal:非配对的样本具有不平等的变异性;
  • alpha(#):设定第一类错误概率水平,默认为 0.05。

2.2.2 tostpr 命令

* 单样本比例等值 z 检验
tostpr varname == # [if] [in] [, eqvtype(type) eqvlevel(#)
uppereqvlevel(#) alpha(#)]

* 双样本比例等值 z 检验
tostpr varname1 == varname2 [if] [in] [, eqvtype(type)
eqvlevel(#) yates ha uppereqvlevel(#) alpha(#)]

* 两组比例等值 z 检验
tostpr varname [if] [in] , by(groupvar) [eqvtype(type)
eqvlevel(#) uppereqvlevel(#) yates ha alpha(#)]

该命令选项与 tostt 命令基本一致,此处不再赘述。

2.2.3 tostsignrank 命令

* 配对符号秩检验,用于配对或匹配数据的分布,等价于对称且以零为中心的数据
tostsignrank varname = exp [if] [in] [, eqvtype(type) eqvlevel(#)
uppereqvlevel(#) ccontinuity alpha(#) relevance]

上述命令选项中,ccontinuity 指定数据是否需要对连续性进行修正。

3. 案例介绍

3.1 tostt 命令应用实例

3.1.1 单样本均值等值 t 检验

. sysuse auto, clear
. tostt mpg==20, eqvt(delta) eqvl(2.5) upper(3)

One-sample t test for mean equivalence
------------------------------------------------------------------------------
Variable | Obs Mean Std. err. Std. dev. [95% conf. interval]
---------+--------------------------------------------------------------------
mpg | 74 21.2973 .6725511 5.785503 19.9569 22.63769
---------+--------------------------------------------------------------------
Δu-θ | 1.702703 .6725511 .3623103 3.043095
θ-Δl | 3.797297 .6725511 2.456905 5.13769
------------------------------------------------------------------------------
θ = mean(mpg) - 20
Δl = -2.5000 Δl expressed in same units as mpg
Δu = 3.0000 Δu expressed in same units as mpg
df = 73 using 74 - 1

Ho: θ <= Δl, or θ >= Δu:

t1 = 2.532 t2 = 5.646

Ho1: Δu-θ <= 0 Ho2: θ-Δl <= 0
Ha1: Δu-θ > 0 Ha2: θ-Δl > 0
Pr(T > t1) = 0.0068 Pr(T > t2) = 0.0000

根据上述检验结果可知,tostt 命令将该假设转换为两个单侧检验,并且都在 1% 的统计水平上拒绝原假设。

3.1.2 配对双样本均值等值 t 检验

. webuse fuel, clear
. tostt mpg1==mpg2, eqvt(epsilon) eqvl(3) rel

Paired t test
------------------------------------------------------------------------------
Variable | Obs Mean Std. err. Std. dev. [95% conf. interval]
---------+--------------------------------------------------------------------
mpg1 | 12 21 .7881701 2.730301 19.26525 22.73475
mpg2 | 12 22.75 .9384465 3.250874 20.68449 24.81551
---------+--------------------------------------------------------------------
diff | 12 -1.75 .7797144 2.70101 -3.46614 -.0338602
------------------------------------------------------------------------------
mean(diff) = mean(mpg1 - mpg2) t = -2.2444
H0: mean(diff) = 0 Degrees of freedom = 11

Ha: mean(diff) < 0 Ha: mean(diff) != 0 Ha: mean(diff) > 0
Pr(T < t) = 0.0232 Pr(|T| > |t|) = 0.0463 Pr(T > t) = 0.9768

Paired t test for mean equivalence
------------------------------------------------------------------------------
Variable | Obs Mean Std. err. Std. dev. [95% conf. interval]
---------+--------------------------------------------------------------------
mpg1 | 12 21 .7881701 2.730301 19.26525 22.73475
mpg2 | 12 22.75 .9384465 3.250874 20.68449 24.81551
---------+--------------------------------------------------------------------
θ | 12 -1.75 .7797144 2.70101 -3.46614 -.0338602
------------------------------------------------------------------------------
mean(θ) = mean(mpg1 - mpg2)
ε = 3.0000 ε expressed in units of the t distribution
df = 11

Ho: |T| >= ε:

t1 = 5.244 t2 = .7556

Ho1: ε-T <= 0 Ho2: T+ε <= 0
Ha1: ε-T > 0 Ha2: T+ε > 0
Pr(T > t1) = 0.0001 Pr(T > t2) = 0.2329

Relevance test conclusion for α = 0.05, and ε = 3:
Ho test for difference: Reject
Ho test for equivalence: Fail to reject
Conclusion from combined tests: Relevant difference

对于配对双样本检验,由于两个单侧检验结果并非一致,因此需要在 tostt 命令中增加选项 relevance,综合检验结果显示存在相对差异。

3.2 tostpr 命令应用实例

3.2.1 单样本比例等值 z 检验

. sysuse auto, clear
. tostpr foreign==.4, eqvt(delta) eqvl(.15) upper(.2) rel

One-sample test of proportion Number of obs = 74
------------------------------------------------------------------------------
Variable | Mean Std. err. [95% conf. interval]
-------------+----------------------------------------------------------------
foreign | .2972973 .0531331 .1931583 .4014363
------------------------------------------------------------------------------
p = proportion(foreign) z = -1.8034
H0: p = 0.4

Ha: p < 0.4 Ha: p != 0.4 Ha: p > 0.4
Pr(Z < z) = 0.0357 Pr(|Z| > |z|) = 0.0713 Pr(Z > z) = 0.9643

One-sample test of proportion equivalence foreign: Number of obs = 74
------------------------------------------------------------------------------
Variable | Mean Std. Err. [95% Conf. Interval]
-------------+----------------------------------------------------------------
foreign | .2972973 .0531331 .1931583 .4014363
-------------+----------------------------------------------------------------
Δu-θ | .3027027 .0569495 .1910838 .4143216
θ-Δl | .0472973 .0569495 -.0643216 .1589162
------------------------------------------------------------------------------
θ = prop(foreign) - .4 = -.1027027
Δl = -0.1500 Δl expressed in same units as prop(foreign)
Δu = 0.2000 Δu expressed in same units as prop(foreign)

Ho: θ <= Δl, or θ >= Δu:

z1 = 5.315 z2 = .8305

Ho1: Δu-θ <= 0 Ho2: θ-Δl <= 0
Ha1: Δu-θ > 0 Ha2: θ-Δl > 0
Pr(Z > z1) = 0.0000 Pr(Z > z2) = 0.2031

Relevance test conclusion for α = 0.05, Δl = -0.15, and Δu = 0.2:
Ho test for difference: Fail to reject
Ho test for equivalence: Fail to reject
Conclusion from combined tests: Indeterminate (underpowered test)

通过上述检验可以发现,无论是绝对数量差异性检验,还是在选定的 delta 水平下,均无法拒绝原假设。

3.2.2 双样本比例等值检验

. webuse cure, clear
. tostpr cure1==cure2, eqvt(epsilon) eqvl(2.5) rel

Two-sample test of proportions cure1: Number of obs = 50
cure2: Number of obs = 59
------------------------------------------------------------------------------
Variable | Mean Std. err. z P>|z| [95% conf. interval]
-------------+----------------------------------------------------------------
cure1 | .52 .0706541 .3815205 .6584795
cure2 | .7118644 .0589618 .5963013 .8274275
-------------+----------------------------------------------------------------
diff | -.1918644 .0920245 -.372229 -.0114998
| under H0: .0931155 -2.06 0.039
------------------------------------------------------------------------------
diff = prop(cure1) - prop(cure2) z = -2.0605
H0: diff = 0

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(Z < z) = 0.0197 Pr(|Z| > |z|) = 0.0394 Pr(Z > z) = 0.9803

Two-sample test of proportion equivalence cure1: Number of obs = 50
cure2: Number of obs = 59
------------------------------------------------------------------------------
Variable | Mean Std. Err. [95% Conf. Interval]
-------------+----------------------------------------------------------------
cure1 | .52 .0706541 .3815205 .6584795
cure2 | .7118644 .0589618 .5963013 .8274275
-------------+----------------------------------------------------------------
θ | -.1918644 .0931155 -.3743675 -.0093613
------------------------------------------------------------------------------
θ = prop(cure1) - prop(cure2) = -.19186441
ε = 2.5000 ε expressed in units of the z distribution

Ho: |Z| >= ε:

z1 = 4.56 z2 = .4395

Ho1: ε-Z <= 0 Ho2: Z+ε <= 0
Ha1: ε-Z > 0 Ha2: Z+ε > 0
Pr(Z > z1) = 0.0000 Pr(Z > z2) = 0.3301

Relevance test conclusion for α = 0.05, and ε = 2.5:
Ho test for difference: Reject
Ho test for equivalence: Fail to reject
Conclusion from combined tests: Relevant difference

通过上述检验可以发现,两组样本在绝对数量上存在显著差异,但在指定的 epsilon 范围内无法拒绝原假设。

3.3 tostsignrank 命令应用实例

. webuse fuel, clear
. tostsignrank mpg1 = mpg2, eqvt(epsilon) eqvl(2.46) rel

Relevance signed-rank test
Wilcoxon signed-rank test
Sign | Obs Sum ranks Expected
-------------+---------------------------------
Positive | 3 13.5 38.5
Negative | 8 63.5 38.5
Zero | 1 1 1
-------------+---------------------------------
All | 12 78 78

Unadjusted variance 162.50
Adjustment for ties -1.63
Adjustment for zeros -0.25
----------
Adjusted variance 160.63

H0: mpg1 = mpg2
z = -1.973
Prob > |z| = 0.0485
Exact prob = 0.0479

Signed-rank test for the distribution of paired or matched data being
equivalent to one that is symmetrical & centered on zero

sign | obs sum ranks expected
-------------+---------------------------------
positive | 3 13.5 38.5
negative | 8 63.5 38.5
zero | 1 1 1
-------------+---------------------------------
all | 12 78 78

unadjusted variance 162.5
adjustment for ties -1.625
adjustment for zeros -.25
----------
adjusted variance 160.625

ε = 2.4600 ε expressed in units of the z distribution

Ho: |Z| >= ε:

z1 = 4.433 z2 = .4874

Ho1: ε-Z <= 0 Ho2: Z+ε <= 0
Ha1: ε-Z > 0 Ha2: Z+ε > 0
Pr(Z > t1) = 0.0000 Pr(Z > t2) = 0.3130

Relevance test conclusion for α = 0.05, and ε = 2.46:
Ho test for difference: Reject
Ho test for equivalence: Fail to reject
Conclusion from combined tests: Relevant difference

通过上述检验可以发现,配对样本的符号秩检验在绝对数量上存在显著差异,但在指定的 epsilon 范围内无法拒绝原假设。

4. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 差异检验, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:Stata教程
    • Stata:自己动手做组间系数差异检验-bootstrap-bdiff
  • 专题:Stata命令
    • 品头论足-distcomp:组间分布差异检验
  • 专题:数据处理
    • Stata:多变量均值和中位数差异检验
  • 专题:回归分析
    • Stata:OLS与WLS的差异检验

课程推荐:因果推断实用计量方法
主讲老师:丘嘉平教授
🍓 课程主页https://gitee.com/lianxh/YGqjp

New! Stata 搜索神器:lianxhsongbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉  使用:
. lianxh DID 倍分法
. songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存