查看原文
其他

Mplus | 软件安装与常用命令解读

李悦 自我整合 2023-02-24

软件安装与常用命令解读

1 Mplus简介

Mplus是一款功能强大的潜变量建模软件,其综合了数个潜变量分析方法于一个统一的分析框架内。

Mplus的第一版发布于1998年底,经过10多年的完善,最近一次升级为2017年发布的第8版。当前的Mplus 8提供了多个操作系统版(Windows, Mac OS X, 和Linux)。

Mplus主要处理如下模型:探索性因素分析(EFA)、验证性因素分析(CFA)、结构方程模型(SEM)、项目反应理论(IRT)、潜类别分析(LCA)、潜在转换分析(LTA)、生存分析、增长模型、多水平模型、复杂数据、蒙特卡洛模拟等。

Mplus由基本主程序和两个扩展模块组成:多水平(Multilevel Add-on)和混合模型(Mixture Add-on)。通过不同搭配,Mplus提供四种不同的功能组合:

基本程序、基本程序+混合模型模块、基本程序+多水平模型模块、基本程序+两个模块组合。

可从Mplus主页下载演示版,具有全部分析功能,只是处理变量数量上受到限制。网址:http://www.statmodel.com/demo.shtml


2 Mplus安装与运行过程

2.1 Mplus的安装环境

(1)操作系统:

(a)Microsoft Windows 2000/XP/Vista/7;

(b)Mac OS X 10.4 或更新版本;

(c)Linux (Ubuntu, RedHat, Fedora, Debian, 和Gentoo)。

(2)内存大于1 GB;

(3)至少120 MB的硬盘存储空间。


2.2 Mplus 运行过程

1)程序输入注意事项:

Mplus默认命令字符为蓝色字体,其他为黑色字体;

注释通过感叹号“!”引导开始,为草绿色字体,“!”后的语句作为注解,Mplus自动忽略;

命令只能包含字母,数字和特定字符,汉字不能识别(title可为汉字);

全程输入必须为英文半角;不可以数字开头。

2)模型定义完成后,首先保存,然后点击 RUN 图标,程序将会进入dos运行界面。

3)Mplus的程序语言:

1.TITLE

2.DATA

3.VARIABLE

4.DEFINE

5.ANALYSIS

6.MODEL:

7.OUTPUT:

8.SAVEDATA:

9.PLOT:

10.MONTECARLO:


3 Mplus常用命令

3.1 标题(Title)

可中文可英文;不是必须命令;尽量不要出现Mplus 的命令字符,避免产生不必要的错误。


3.2 数据(DATA)

DATA是Mplus 必须的命令,用于指定数据文件存放的路径。


3.2.1 数据文件的路径设置

FILE语句用于指定数据文件的存储路径和文件名。例如,FILE is c:\mplus\ptsd.dat;

Mplus只能读取AASCII格式文件(通常后缀为.dat和.txt)可用SPSS进行转换;

变量数上限是1500,字符的长度是5000。


3.2.2 数据文件的格式设置

Mplus可以识别自由和固定两种结构的数据,固定数据的格式读取更快。

自由格式

自由格式的文件中,每列为一个变量,标量之间用空格、逗号或制表符进行限定,缺失值必须用“.”或其他数值代替(如,9或99),否则会发生读取错误。

 打开SPSS文件→FILE→SAVE DATA→对话框选择保存文件类型,下拉选项中选择“Tab-delimited(*.dat)”格式,最后点击确定。

在使用前需要通过SPSS保存的dat文件时,要把原数据文件中的变量名等(非数值型)不需要的信息删去,以避免错误。

固定格式

每个变量所占字符数必须相等,FORTRAN式的定义是可以被Mplus接受的。常用的FORTRAN的描述符有“F”“x”“t”“/”。


3.2.3 提供数据文件的内容信息

数据文件的路径和格式等设置好后,还需要提供数据文件的内容信息,这是通过TYPE来实现的,一般来说,数据文件要么提供单个信息,要么提供汇总信息。

TYPE命令下共有9种类型可供选择:

• INDIVIDUAL; 单个数据或原始数据

• COVARIANCE; 下三角协方差矩阵

• CORRELATION;下三角相关矩阵

• FULLCOV; 全角协方差矩阵

• FULLCORR; 全角相关矩阵

• MEANS; 均值

• STDEVIATIONS;标准差

• MONTECARLO; 蒙特卡洛数据

• IMPUTATION; 替补数据

其中最常用的是INDIVIDUAL即提供原始数据,也是程序默认的数据类型。

在社会科学研究中,绝大多数数据以INDIVIDUAL类型存储(通过SPSS转换后的*.dat文件即为这种形式),因此多数情况下不需要TYPE语句。

 当其他情况下需要使用汇总数据(summary data)时(原始数据无法获得,或是需要对某些概念间的相关系数矩阵或协方差矩阵进行元分析),汇总数据必须为自由格式的外部ASCII文件,而且需要使用NOBSERVATIONS注名样本量的大小(例如:TYPE IS CORRELATION MEANS STDEVIATIONS;),汇总数据必须提供观测变量的个数,在DATA1后加:“NOBSERVATIONS=1000”.

PS: DATA命令下还提供对数据结构进行转换的指令,可参考Mplus6.0 用户手册465-471页。


3.3 变量(VARIABLE)

整理数据和使用变量命令来定义变量——非常重要。

变量命令有3个功能:

• ①定义数据文件中的变量;

• ②选择分析使用的变量;

• ③定义变量的类型或尺度(scale)。


3.3.1 VARIABL定义数据文件中的变量

数据文件中除了文字之外,不允许其他变量名称的字符存在,所以在分析数据之前需要给数据文件中出现的数据命名。

给每列变量指定一个标签,所有变量都要有名称;

变量名最多允许8个字符,超过8个自动忽略;

(如,VARIABLE IS/ARE/= y1 y2 y3 y4 y5;)


3.3.2 USEVARIABLE选择分析使用的变量

某项分析可能只涉及到部分变量,所以在具体分析之前要对所使用的变量进行选择,使用USEVARIABLES来定义:(如,VARIABLES= y1-y10;USEVARIABLES ARE/= y1 y2 y3 y4 y5;或USEVARIABLES ARE/= y1-y5;)


3.3.3 定义变量的类型或尺度(scale)

很重要,Mplus中不同的统计方法是根据指定的变量类型进行的。(包括:CONTINUOUS 连续、CATEGORICAL 类别、COUNT 计数、NOMINAL 名义、CENSORED截尾)


3.3.4 USEOBSERVATIONS

用于选择符合特定条件的样本。(例如:USEOBSERVATIONS = ethnic EQ 1 AND gender EQ 2; !符合种族是1同时性别是2的case参与分析。)

逻辑符:

AND :和;

OR :或者;

NOT :否;

EQ :等于;

NE :不等于或“/=”;

GE :大于等于或“>=”;

LE :小于等于或“<=”;

GT :大于或“>”;

LT :小于或“<”。


3.3.5 缺失值的定义

MISSING用于定义数据文件中的缺失值,Mplus提供给两种缺失值标记:数值型和非数值型。

数值型标记是通过指定数据文件中的某几个数值代表数据缺失,不同变量可以设置不同的标签即数值;同一变量可以设置2个不同的标签。(例如:“MISSING = y1-y10(9);”、“MISSING = y1(9) y2(9 99)”、“MISSING = ALL (9) ”等)

非数值型采用某种符号代表数据缺失。可以是符号、数值或空白,但空白不能用于自由格式数据文件。(例如:“MISSING ARE variable (#);. ; * ;”、“ MISSING =.;”、“MISSING = BLANK;”等。)


3.3.6 Centering & 中心化

Mplus提供两种中心化方法:总均值中心化(GRANDMEAN)和组均值中心化(GROUPMEAN)。前者是所有原始数据减去全体样本的均值,后者为所有原始数据减去所在组的均值。 


3.3.7 定义(DEFFINE)

DEFFINE 可以通过加减乘除和逻辑转换定义新变量,也可以使用数据转换命令计算或转换新变量,产生的新变量必须写入USEVARIABLE。

常用的数据转换命令如下:

MEAN 通过平均几个变量的均值定义新变量

CLUSTER_MEAN/CLUSTER 定义每个CLUSTER种个体水平的均值。

SUM 通过求几个变量的和定义新变量

CUT 通过预定的切分点将变量划分为类别变量

DEFINE中常使用的代数运算符合:

+ addition y + x;

- subtraction y - x;

* multiplication y * x;

/ division y / x;

** exponentiation y**2;

% remainder remainder of y/x;


3.3.8 分析(ANALYSIS)

分析命令设计的主要是参数估计方法。

其表达式为:

ANALYSIS:

TYPE = 分析类型;

• = GENERAL ! 分析的类型为一般(default);

• = MIXTURE ! 分析的类型为混合模型;

• = TWOLEVE ! 分析的类型为两水平模型;

• = EFA # # ! 分析的类型为探索性因素分析;

• = MIXTURE ! 混合模型分析;


ESTIMATOR =参数估计方法;

• =MLM ! 稳健极大似然估计;

• =ML; 极大似然估计,最常用的参数估计法;

• =MLR; 稳健极大似然估计适用于非正态和非独立数据(复杂数据结构,与TYPE=COMPLEX合用)标准误采用sandwich估计法;

• =WLSMV; 加权最小二乘法估计,使用对角加权矩阵伴均值-方差校正卡方检验。

• =MLMV估计; 极大似然估计伴标准误和均值-方差校正卡方检验,用于非正态数据估计。

• =MLF 极大似然估计伴一阶衍生近似标准误和传统卡方检验。

• =MUML 有限信息参数估计。

• =WLS 加权最小二乘法估计。

• =WLSM 加权最小二乘法估计伴均值校正卡方检验。

• =WLSMV 加权最小二乘法估计使用对角加权矩阵伴均值-方差校正卡方检验。

• =ULS 非加权最小二乘法;

• =ULSMV非加权最小二乘法使用全部加权矩阵伴均值-方差校正卡方检验。

• =GLS 广义最小二乘法。


3.3.9 模型(MODEL)

主要用于对假设模型进行设定。

1)自由估计

将默认设置改成自由估计

在Mplus中执行因素分析时,为了统一测量单位,程序默认第一个条目的因子负荷为1,通过*可以将程序默认值改为自由估计。(例:F1 by y1* y2 y3 y4; )

指定开始值(例如:F1 on F2*0.1)

2)固定参数

通过使用@固定某些参数为特定的数值。(例如:F1 by y1 y2 @ 0.5 )

固定参数相等(number)

通过在变量后加(number),后面数字相等的参数被限定参数相等。(例:F1 by y1-y5(1-5)

命名参数(name)通过在变量后加(name),为参数指定标签;(例:F1 BY Y1-Y3(la1-la3))

3)MODEL模块中用于设定模型的语句:

BY 通过指标定义潜变量,By 定义测量

(例如:f1 BY y1-y5,因子f1由y1 y2 y3 y4 y5 五个外显指标测量)

ON 定义回归关系

(例如:f1 ON f2-f4; !因子f2 f3 f3三个变量预测因子f1;

f1 ON x1 x2;!观测指标x1 x2预测因子f1;

f1-f3 ON x1-x3; 等价于f1 ON x1 x2 x3; f2 ON x1 x2 x3; f3 ON x1 x2 x3;)

PON 定义配对回归关系

(例如:f1 f2 PON f3 f4等价于f1 ON f3; f2 ON f4;)

WITH 定义相关或协方差相关

(例如:f1 WITH f2; 因子f1与因子f2相关)

PWITH 定义配对相关或协方差关系

(例如:f1 f2 PWITH f3 f4; 等价于f1WITH f3;f2 WITH f4;)

MODEL INDIRECT: 描述间接效应和总效应

VIA描述一组包含特定中介变量的间接效应

 VIA与IND类似,左边的为因变量,右边最后一个为自变量,右边其他变量为中介变量。VIA指定的是所有经过中介变量由自变量到因变量的间接效应。

(例如:y3 VIA y1 x1 ; 表示所有通过中介y1,自变量x1作用于因变量y3的中介效应)

CONSTRAINT模型设定命令

通过该命令可以设定模型估计参数间的线性和非线性关系。

PS: 计算描述统计量的一个例子:

Data: File is chnspress_wide.dat ;

Variable: Names are id gender bmi89 bmi91 bmi93 bmi97 bmi00 bmi04 bmi06

pre89 pre91 pre93 pre97 pre00 pre04 pre06;

Missing are all (-9999) ;

USEVARIABLES = pre89 pre91 pre93 pre97;

Model: pre89 pre91 pre93 pre97;!计算方差

[pre89 pre91 pre93 pre97](m1-m4);!计算均值

pre89 pre91 pre93 pre97 with pre89 pre91 pre93 pre97;!计算协方差

model test:

m1=m2; !m2=m3;m3=m4;

Output: standardized patterns;

结果:

3.3.10 输出(OUTPUT)

通过该命令获得模型分析结果。

在OUTPUT下,有如下几个常用的语句:

• SAMPSTAT:要求报告的样本统计量。

• CROSSTABS:提供类别变量间的交叉频率表。

• STANDARDIZED:要求提供标准化参数统计量及对应的标准误。

• RESIDUAL:要求提供观察变量的残差值。

• MODINDICES:提供模型修正指数,期望参数变化指数,和两种标准化期望参数变化等信息。

• CINTERVAL:要求报告参数置信区间值。

• TECH1-TECH14;14个技术报告


3.3.10 保存(SAVEDATA)

用于保存分析的数据以及分析的结果。

常用的保存信息命令如下:

• FILE IS newdata.dat; 指分析所用数据保存在以newdata.dat命名的文件中。

• SAMPLE IS sample.dat;样本统计量如相关、协方差矩阵保存在以sample.dat命名的文件中。

• RESULTS IS results.dat; 分析的结果被保存在以results.dat命名的文件中。

• DIFFETST IS diffetest.dat; WLSMV和MLMV估计时,嵌套模型比较的信息被保存在以diffetest.dat命名的文件中,见第九章。

• THCH3 IS tech3.dat; 技术文件3的信息被保存在以tech3.dat命名的文件中


3.3.11 绘图(PLOT)

绘图不是Mplus的强项,但依然可以通过该命令获得简单的图形。

命令如下:

TYPE IS  PLOT1;获得样本的直方图,散点图和样本均值

PLOT2;提供项目特征曲线,信息曲线,EFA分析时的碎石土等。

PLOT3 潜类别条件概率。

绘图结果在模型运行结束后通过GRAPH下拉菜单的view graphs查看。


3.3.12 蒙特卡洛(MONTECARLO)

是使用Mplus做模拟研究时使用的命令。 以上内容来源:王孟成老师培训课件

声明:部分文章和信息来源于互联网,如转载内容涉及版权等问题,请立即与小编联系,我们将迅速采取适当的措施。

感谢您抽出  · 来阅读此文

更多精彩请点击下列分类文章

↓↓↓

Meta分析 | 文献检索的基本技巧

撰写学术论文的检查清单

科研经历分享专题(二)

Meta分析 | 检索主题词

Mplus | 潜变量分析模型概述

治疗

在分别时把它投掷出来是在说和不说之间的一个妥协,这样的交流可能会充满情感,所以它只能在治疗结束时被说出来,这样治疗师就没有机会来做回应了。

向左滑动

关注“自我整合”

从心开始做更好

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存