Mplus | 软件安装与常用命令解读

Original 李悦自我整合 2023-02-24

软件安装与常用命令解读

1 Mplus简介

Mplus是一款功能强大的潜变量建模软件，其综合了数个潜变量分析方法于一个统一的分析框架内。

Mplus的第一版发布于1998年底，经过10多年的完善，最近一次升级为2017年发布的第8版。当前的Mplus 8提供了多个操作系统版(Windows, Mac OS X, 和Linux)。

Mplus主要处理如下模型：探索性因素分析（EFA）、验证性因素分析（CFA）、结构方程模型（SEM）、项目反应理论（IRT）、潜类别分析（LCA）、潜在转换分析（LTA）、生存分析、增长模型、多水平模型、复杂数据、蒙特卡洛模拟等。

Mplus由基本主程序和两个扩展模块组成：多水平（Multilevel Add-on）和混合模型（Mixture Add-on）。通过不同搭配，Mplus提供四种不同的功能组合：

基本程序、基本程序+混合模型模块、基本程序+多水平模型模块、基本程序+两个模块组合。

可从Mplus主页下载演示版，具有全部分析功能，只是处理变量数量上受到限制。网址：http://www.statmodel.com/demo.shtml

2 Mplus安装与运行过程

2.1 Mplus的安装环境

(1)操作系统：

(a)Microsoft Windows 2000/XP/Vista/7；

(b)Mac OS X 10.4 或更新版本；

(c)Linux (Ubuntu, RedHat, Fedora, Debian, 和Gentoo)。

(2)内存大于1 GB；

(3)至少120 MB的硬盘存储空间。

2.2 Mplus 运行过程

1）程序输入注意事项：

Mplus默认命令字符为蓝色字体，其他为黑色字体；

注释通过感叹号“！”引导开始，为草绿色字体，“！”后的语句作为注解，Mplus自动忽略；

命令只能包含字母，数字和特定字符，汉字不能识别（title可为汉字）；

全程输入必须为英文半角；不可以数字开头。

2）模型定义完成后，首先保存，然后点击 RUN 图标，程序将会进入dos运行界面。

3）Mplus的程序语言：

1.TITLE

2.DATA

3.VARIABLE

4.DEFINE

5.ANALYSIS

6.MODEL:

7.OUTPUT:

8.SAVEDATA:

9.PLOT:

10.MONTECARLO:

3 Mplus常用命令

3.1 标题（Title）

可中文可英文；不是必须命令；尽量不要出现Mplus 的命令字符，避免产生不必要的错误。

3.2 数据（DATA）

DATA是Mplus 必须的命令，用于指定数据文件存放的路径。

3.2.1 数据文件的路径设置

FILE语句用于指定数据文件的存储路径和文件名。例如，FILE is c:\mplus\ptsd.dat;

Mplus只能读取AASCII格式文件（通常后缀为.dat和.txt）可用SPSS进行转换；

变量数上限是1500，字符的长度是5000。

3.2.2 数据文件的格式设置

Mplus可以识别自由和固定两种结构的数据，固定数据的格式读取更快。

自由格式

自由格式的文件中，每列为一个变量，标量之间用空格、逗号或制表符进行限定，缺失值必须用“.”或其他数值代替（如，9或99），否则会发生读取错误。

打开SPSS文件→FILE→SAVE DATA→对话框选择保存文件类型，下拉选项中选择“Tab-delimited(*.dat)”格式，最后点击确定。

在使用前需要通过SPSS保存的dat文件时，要把原数据文件中的变量名等（非数值型）不需要的信息删去，以避免错误。

固定格式

每个变量所占字符数必须相等，FORTRAN式的定义是可以被Mplus接受的。常用的FORTRAN的描述符有“F”“x”“t”“/”。

3.2.3 提供数据文件的内容信息

数据文件的路径和格式等设置好后，还需要提供数据文件的内容信息，这是通过TYPE来实现的，一般来说，数据文件要么提供单个信息，要么提供汇总信息。

TYPE命令下共有9种类型可供选择：

• INDIVIDUAL; 单个数据或原始数据

• COVARIANCE; 下三角协方差矩阵

• CORRELATION;下三角相关矩阵

• FULLCOV; 全角协方差矩阵

• FULLCORR; 全角相关矩阵

• MEANS; 均值

• STDEVIATIONS;标准差

• MONTECARLO; 蒙特卡洛数据

• IMPUTATION; 替补数据

其中最常用的是INDIVIDUAL即提供原始数据，也是程序默认的数据类型。

在社会科学研究中，绝大多数数据以INDIVIDUAL类型存储（通过SPSS转换后的*.dat文件即为这种形式），因此多数情况下不需要TYPE语句。

当其他情况下需要使用汇总数据（summary data）时（原始数据无法获得，或是需要对某些概念间的相关系数矩阵或协方差矩阵进行元分析），汇总数据必须为自由格式的外部ASCII文件，而且需要使用NOBSERVATIONS注名样本量的大小（例如：TYPE IS CORRELATION MEANS STDEVIATIONS;），汇总数据必须提供观测变量的个数，在DATA1后加：“NOBSERVATIONS=1000”.

PS: DATA命令下还提供对数据结构进行转换的指令，可参考Mplus6.0 用户手册465-471页。

3.3 变量（VARIABLE）

整理数据和使用变量命令来定义变量——非常重要。

变量命令有3个功能：

• ①定义数据文件中的变量；

• ②选择分析使用的变量；

• ③定义变量的类型或尺度(scale)。

3.3.1 VARIABL定义数据文件中的变量

数据文件中除了文字之外，不允许其他变量名称的字符存在，所以在分析数据之前需要给数据文件中出现的数据命名。

给每列变量指定一个标签，所有变量都要有名称；

变量名最多允许8个字符，超过8个自动忽略；

（如，VARIABLE IS/ARE/= y1 y2 y3 y4 y5;）

3.3.2 USEVARIABLE选择分析使用的变量

某项分析可能只涉及到部分变量，所以在具体分析之前要对所使用的变量进行选择，使用USEVARIABLES来定义：（如，VARIABLES= y1-y10;USEVARIABLES ARE/= y1 y2 y3 y4 y5；或USEVARIABLES ARE/= y1-y5;）

3.3.3 定义变量的类型或尺度(scale)

很重要，Mplus中不同的统计方法是根据指定的变量类型进行的。（包括：CONTINUOUS 连续、CATEGORICAL 类别、COUNT 计数、NOMINAL 名义、CENSORED截尾）

3.3.4 USEOBSERVATIONS

用于选择符合特定条件的样本。（例如：USEOBSERVATIONS = ethnic EQ 1 AND gender EQ 2; !符合种族是1同时性别是2的case参与分析。）

逻辑符：

• AND ：和；

• OR ：或者；

• NOT ：否；

• EQ ：等于；

• NE ：不等于或“/=”；

• GE ：大于等于或“>=”；

• LE ：小于等于或“<=”；

• GT ：大于或“>”；

• LT ：小于或“<”。

3.3.5 缺失值的定义

MISSING用于定义数据文件中的缺失值，Mplus提供给两种缺失值标记：数值型和非数值型。

数值型标记是通过指定数据文件中的某几个数值代表数据缺失，不同变量可以设置不同的标签即数值；同一变量可以设置2个不同的标签。（例如：“MISSING = y1-y10(9);”、“MISSING = y1(9) y2(9 99)”、“MISSING = ALL (9) ”等）

非数值型采用某种符号代表数据缺失。可以是符号、数值或空白，但空白不能用于自由格式数据文件。（例如：“MISSING ARE variable (#);. ; * ;”、“ MISSING =.；”、“MISSING = BLANK;”等。）

3.3.6 Centering & 中心化

Mplus提供两种中心化方法：总均值中心化(GRANDMEAN)和组均值中心化(GROUPMEAN)。前者是所有原始数据减去全体样本的均值，后者为所有原始数据减去所在组的均值。

3.3.7 定义（DEFFINE）

DEFFINE 可以通过加减乘除和逻辑转换定义新变量，也可以使用数据转换命令计算或转换新变量，产生的新变量必须写入USEVARIABLE。

常用的数据转换命令如下：

MEAN 通过平均几个变量的均值定义新变量

CLUSTER_MEAN/CLUSTER 定义每个CLUSTER种个体水平的均值。

SUM 通过求几个变量的和定义新变量

CUT 通过预定的切分点将变量划分为类别变量

DEFINE中常使用的代数运算符合:

• + addition y + x;

• - subtraction y - x;

• * multiplication y * x;

• / division y / x;

• ** exponentiation y**2;

• % remainder remainder of y/x;

3.3.8 分析（ANALYSIS）

分析命令设计的主要是参数估计方法。

其表达式为：

ANALYSIS:

TYPE = 分析类型；

• = GENERAL ! 分析的类型为一般(default)；

• = MIXTURE ! 分析的类型为混合模型；

• = TWOLEVE ! 分析的类型为两水平模型；

• = EFA # # ! 分析的类型为探索性因素分析；

• = MIXTURE ! 混合模型分析；

ESTIMATOR =参数估计方法；

• =MLM ! 稳健极大似然估计；

• =ML; 极大似然估计，最常用的参数估计法；

• =MLR; 稳健极大似然估计适用于非正态和非独立数据（复杂数据结构，与TYPE=COMPLEX合用）标准误采用sandwich估计法；

• =WLSMV; 加权最小二乘法估计，使用对角加权矩阵伴均值-方差校正卡方检验。

• =MLMV估计; 极大似然估计伴标准误和均值-方差校正卡方检验，用于非正态数据估计。

• =MLF 极大似然估计伴一阶衍生近似标准误和传统卡方检验。

• =MUML 有限信息参数估计。

• =WLS 加权最小二乘法估计。

• =WLSM 加权最小二乘法估计伴均值校正卡方检验。

• =WLSMV 加权最小二乘法估计使用对角加权矩阵伴均值-方差校正卡方检验。

• =ULS 非加权最小二乘法；

• =ULSMV非加权最小二乘法使用全部加权矩阵伴均值-方差校正卡方检验。

• =GLS 广义最小二乘法。

3.3.9 模型（MODEL）

主要用于对假设模型进行设定。

1）自由估计

将默认设置改成自由估计

在Mplus中执行因素分析时，为了统一测量单位，程序默认第一个条目的因子负荷为1，通过*可以将程序默认值改为自由估计。（例：F1 by y1* y2 y3 y4; ）

指定开始值（例如：F1 on F2*0.1）

2）固定参数

通过使用@固定某些参数为特定的数值。（例如：F1 by y1 y2 @ 0.5 ）

固定参数相等(number)

通过在变量后加(number)，后面数字相等的参数被限定参数相等。（例：F1 by y1-y5(1-5)

命名参数(name)通过在变量后加(name)，为参数指定标签；（例：F1 BY Y1-Y3(la1-la3)）

3）MODEL模块中用于设定模型的语句：

BY 通过指标定义潜变量，By 定义测量

（例如：f1 BY y1-y5，因子f1由y1 y2 y3 y4 y5 五个外显指标测量）

ON 定义回归关系

（例如：f1 ON f2-f4; !因子f2 f3 f3三个变量预测因子f1;

f1 ON x1 x2;!观测指标x1 x2预测因子f1;

f1-f3 ON x1-x3; 等价于f1 ON x1 x2 x3; f2 ON x1 x2 x3; f3 ON x1 x2 x3;）

PON 定义配对回归关系

（例如：f1 f2 PON f3 f4等价于f1 ON f3; f2 ON f4;）

WITH 定义相关或协方差相关

（例如：f1 WITH f2; 因子f1与因子f2相关）

PWITH 定义配对相关或协方差关系

（例如：f1 f2 PWITH f3 f4; 等价于f1WITH f3;f2 WITH f4；）

MODEL INDIRECT: 描述间接效应和总效应

VIA描述一组包含特定中介变量的间接效应

VIA与IND类似，左边的为因变量，右边最后一个为自变量，右边其他变量为中介变量。VIA指定的是所有经过中介变量由自变量到因变量的间接效应。

（例如：y3 VIA y1 x1 ; 表示所有通过中介y1，自变量x1作用于因变量y3的中介效应）

CONSTRAINT模型设定命令

通过该命令可以设定模型估计参数间的线性和非线性关系。

PS: 计算描述统计量的一个例子：

Data: File is chnspress_wide.dat ;

Variable: Names are id gender bmi89 bmi91 bmi93 bmi97 bmi00 bmi04 bmi06

pre89 pre91 pre93 pre97 pre00 pre04 pre06;

Missing are all (-9999) ;

USEVARIABLES = pre89 pre91 pre93 pre97;

Model: pre89 pre91 pre93 pre97;!计算方差

[pre89 pre91 pre93 pre97](m1-m4);!计算均值

pre89 pre91 pre93 pre97 with pre89 pre91 pre93 pre97;!计算协方差

model test:

m1=m2; !m2=m3;m3=m4;

Output: standardized patterns;

结果：

3.3.10 输出（OUTPUT）

通过该命令获得模型分析结果。

在OUTPUT下，有如下几个常用的语句：

• SAMPSTAT：要求报告的样本统计量。

• CROSSTABS：提供类别变量间的交叉频率表。

• STANDARDIZED：要求提供标准化参数统计量及对应的标准误。

• RESIDUAL：要求提供观察变量的残差值。

• MODINDICES：提供模型修正指数，期望参数变化指数，和两种标准化期望参数变化等信息。

• CINTERVAL：要求报告参数置信区间值。

• TECH1-TECH14；14个技术报告

3.3.10 保存（SAVEDATA）

用于保存分析的数据以及分析的结果。

常用的保存信息命令如下：

• FILE IS newdata.dat; 指分析所用数据保存在以newdata.dat命名的文件中。

• SAMPLE IS sample.dat;样本统计量如相关、协方差矩阵保存在以sample.dat命名的文件中。

• RESULTS IS results.dat; 分析的结果被保存在以results.dat命名的文件中。

• DIFFETST IS diffetest.dat; WLSMV和MLMV估计时，嵌套模型比较的信息被保存在以diffetest.dat命名的文件中，见第九章。

• THCH3 IS tech3.dat; 技术文件3的信息被保存在以tech3.dat命名的文件中

3.3.11 绘图（PLOT）

绘图不是Mplus的强项，但依然可以通过该命令获得简单的图形。

命令如下：

TYPE IS PLOT1;获得样本的直方图，散点图和样本均值

PLOT2;提供项目特征曲线，信息曲线，EFA分析时的碎石土等。

PLOT3 潜类别条件概率。

绘图结果在模型运行结束后通过GRAPH下拉菜单的view graphs查看。

3.3.12 蒙特卡洛（MONTECARLO）

是使用Mplus做模拟研究时使用的命令。以上内容来源：王孟成老师培训课件

声明：部分文章和信息来源于互联网，如转载内容涉及版权等问题，请立即与小编联系，我们将迅速采取适当的措施。

感谢您抽出 · 来阅读此文

更多精彩请点击下列分类文章

↓↓↓

治疗

在分别时把它投掷出来是在说和不说之间的一个妥协，这样的交流可能会充满情感，所以它只能在治疗结束时被说出来，这样治疗师就没有机会来做回应了。

向左滑动

关注“自我整合”

从心开始做更好

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！

吴京捧红的白眼狼，爆红后却反咬一口，如今落魄到无戏可拍

Mplus | 软件安装与常用命令解读

您可能也对以下帖子感兴趣

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！

吴京捧红的白眼狼，爆红后却反咬一口，如今落魄到无戏可拍

生成图片，分享到微信朋友圈

Mplus | 软件安装与常用命令解读

您可能也对以下帖子感兴趣