Mplus | 软件安装与常用命令解读
软件安装与常用命令解读
1 Mplus简介
Mplus是一款功能强大的潜变量建模软件,其综合了数个潜变量分析方法于一个统一的分析框架内。
Mplus的第一版发布于1998年底,经过10多年的完善,最近一次升级为2017年发布的第8版。当前的Mplus 8提供了多个操作系统版(Windows, Mac OS X, 和Linux)。
Mplus主要处理如下模型:探索性因素分析(EFA)、验证性因素分析(CFA)、结构方程模型(SEM)、项目反应理论(IRT)、潜类别分析(LCA)、潜在转换分析(LTA)、生存分析、增长模型、多水平模型、复杂数据、蒙特卡洛模拟等。
Mplus由基本主程序和两个扩展模块组成:多水平(Multilevel Add-on)和混合模型(Mixture Add-on)。通过不同搭配,Mplus提供四种不同的功能组合:
基本程序、基本程序+混合模型模块、基本程序+多水平模型模块、基本程序+两个模块组合。
可从Mplus主页下载演示版,具有全部分析功能,只是处理变量数量上受到限制。网址:http://www.statmodel.com/demo.shtml
2 Mplus安装与运行过程
2.1 Mplus的安装环境
(1)操作系统:
(a)Microsoft Windows 2000/XP/Vista/7;
(b)Mac OS X 10.4 或更新版本;
(c)Linux (Ubuntu, RedHat, Fedora, Debian, 和Gentoo)。
(2)内存大于1 GB;
(3)至少120 MB的硬盘存储空间。
2.2 Mplus 运行过程
1)程序输入注意事项:
Mplus默认命令字符为蓝色字体,其他为黑色字体;
注释通过感叹号“!”引导开始,为草绿色字体,“!”后的语句作为注解,Mplus自动忽略;
命令只能包含字母,数字和特定字符,汉字不能识别(title可为汉字);
全程输入必须为英文半角;不可以数字开头。
2)模型定义完成后,首先保存,然后点击 RUN 图标,程序将会进入dos运行界面。
3)Mplus的程序语言:
1.TITLE
2.DATA
3.VARIABLE
4.DEFINE
5.ANALYSIS
6.MODEL:
7.OUTPUT:
8.SAVEDATA:
9.PLOT:
10.MONTECARLO:
3 Mplus常用命令
3.1 标题(Title)
可中文可英文;不是必须命令;尽量不要出现Mplus 的命令字符,避免产生不必要的错误。
3.2 数据(DATA)
DATA是Mplus 必须的命令,用于指定数据文件存放的路径。
3.2.1 数据文件的路径设置
FILE语句用于指定数据文件的存储路径和文件名。例如,FILE is c:\mplus\ptsd.dat;
Mplus只能读取AASCII格式文件(通常后缀为.dat和.txt)可用SPSS进行转换;
变量数上限是1500,字符的长度是5000。
3.2.2 数据文件的格式设置
Mplus可以识别自由和固定两种结构的数据,固定数据的格式读取更快。
自由格式
自由格式的文件中,每列为一个变量,标量之间用空格、逗号或制表符进行限定,缺失值必须用“.”或其他数值代替(如,9或99),否则会发生读取错误。
打开SPSS文件→FILE→SAVE DATA→对话框选择保存文件类型,下拉选项中选择“Tab-delimited(*.dat)”格式,最后点击确定。
在使用前需要通过SPSS保存的dat文件时,要把原数据文件中的变量名等(非数值型)不需要的信息删去,以避免错误。
固定格式
每个变量所占字符数必须相等,FORTRAN式的定义是可以被Mplus接受的。常用的FORTRAN的描述符有“F”“x”“t”“/”。
3.2.3 提供数据文件的内容信息
数据文件的路径和格式等设置好后,还需要提供数据文件的内容信息,这是通过TYPE来实现的,一般来说,数据文件要么提供单个信息,要么提供汇总信息。
TYPE命令下共有9种类型可供选择:
• INDIVIDUAL; 单个数据或原始数据
• COVARIANCE; 下三角协方差矩阵
• CORRELATION;下三角相关矩阵
• FULLCOV; 全角协方差矩阵
• FULLCORR; 全角相关矩阵
• MEANS; 均值
• STDEVIATIONS;标准差
• MONTECARLO; 蒙特卡洛数据
• IMPUTATION; 替补数据
其中最常用的是INDIVIDUAL即提供原始数据,也是程序默认的数据类型。
在社会科学研究中,绝大多数数据以INDIVIDUAL类型存储(通过SPSS转换后的*.dat文件即为这种形式),因此多数情况下不需要TYPE语句。
当其他情况下需要使用汇总数据(summary data)时(原始数据无法获得,或是需要对某些概念间的相关系数矩阵或协方差矩阵进行元分析),汇总数据必须为自由格式的外部ASCII文件,而且需要使用NOBSERVATIONS注名样本量的大小(例如:TYPE IS CORRELATION MEANS STDEVIATIONS;),汇总数据必须提供观测变量的个数,在DATA1后加:“NOBSERVATIONS=1000”.
PS: DATA命令下还提供对数据结构进行转换的指令,可参考Mplus6.0 用户手册465-471页。
3.3 变量(VARIABLE)
整理数据和使用变量命令来定义变量——非常重要。
变量命令有3个功能:
• ①定义数据文件中的变量;
• ②选择分析使用的变量;
• ③定义变量的类型或尺度(scale)。
3.3.1 VARIABL定义数据文件中的变量
数据文件中除了文字之外,不允许其他变量名称的字符存在,所以在分析数据之前需要给数据文件中出现的数据命名。
给每列变量指定一个标签,所有变量都要有名称;
变量名最多允许8个字符,超过8个自动忽略;
(如,VARIABLE IS/ARE/= y1 y2 y3 y4 y5;)
3.3.2 USEVARIABLE选择分析使用的变量
某项分析可能只涉及到部分变量,所以在具体分析之前要对所使用的变量进行选择,使用USEVARIABLES来定义:(如,VARIABLES= y1-y10;USEVARIABLES ARE/= y1 y2 y3 y4 y5;或USEVARIABLES ARE/= y1-y5;)
3.3.3 定义变量的类型或尺度(scale)
很重要,Mplus中不同的统计方法是根据指定的变量类型进行的。(包括:CONTINUOUS 连续、CATEGORICAL 类别、COUNT 计数、NOMINAL 名义、CENSORED截尾)
3.3.4 USEOBSERVATIONS
用于选择符合特定条件的样本。(例如:USEOBSERVATIONS = ethnic EQ 1 AND gender EQ 2; !符合种族是1同时性别是2的case参与分析。)
逻辑符:
• AND :和;
• OR :或者;
• NOT :否;
• EQ :等于;
• NE :不等于或“/=”;
• GE :大于等于或“>=”;
• LE :小于等于或“<=”;
• GT :大于或“>”;
• LT :小于或“<”。
3.3.5 缺失值的定义
MISSING用于定义数据文件中的缺失值,Mplus提供给两种缺失值标记:数值型和非数值型。
数值型标记是通过指定数据文件中的某几个数值代表数据缺失,不同变量可以设置不同的标签即数值;同一变量可以设置2个不同的标签。(例如:“MISSING = y1-y10(9);”、“MISSING = y1(9) y2(9 99)”、“MISSING = ALL (9) ”等)
非数值型采用某种符号代表数据缺失。可以是符号、数值或空白,但空白不能用于自由格式数据文件。(例如:“MISSING ARE variable (#);. ; * ;”、“ MISSING =.;”、“MISSING = BLANK;”等。)
3.3.6 Centering & 中心化
Mplus提供两种中心化方法:总均值中心化(GRANDMEAN)和组均值中心化(GROUPMEAN)。前者是所有原始数据减去全体样本的均值,后者为所有原始数据减去所在组的均值。
3.3.7 定义(DEFFINE)
DEFFINE 可以通过加减乘除和逻辑转换定义新变量,也可以使用数据转换命令计算或转换新变量,产生的新变量必须写入USEVARIABLE。
常用的数据转换命令如下:
MEAN 通过平均几个变量的均值定义新变量
CLUSTER_MEAN/CLUSTER 定义每个CLUSTER种个体水平的均值。
SUM 通过求几个变量的和定义新变量
CUT 通过预定的切分点将变量划分为类别变量
DEFINE中常使用的代数运算符合:
• + addition y + x;
• - subtraction y - x;
• * multiplication y * x;
• / division y / x;
• ** exponentiation y**2;
• % remainder remainder of y/x;
3.3.8 分析(ANALYSIS)
分析命令设计的主要是参数估计方法。
其表达式为:
ANALYSIS:
TYPE = 分析类型;
• = GENERAL ! 分析的类型为一般(default);
• = MIXTURE ! 分析的类型为混合模型;
• = TWOLEVE ! 分析的类型为两水平模型;
• = EFA # # ! 分析的类型为探索性因素分析;
• = MIXTURE ! 混合模型分析;
ESTIMATOR =参数估计方法;
• =MLM ! 稳健极大似然估计;
• =ML; 极大似然估计,最常用的参数估计法;
• =MLR; 稳健极大似然估计适用于非正态和非独立数据(复杂数据结构,与TYPE=COMPLEX合用)标准误采用sandwich估计法;
• =WLSMV; 加权最小二乘法估计,使用对角加权矩阵伴均值-方差校正卡方检验。
• =MLMV估计; 极大似然估计伴标准误和均值-方差校正卡方检验,用于非正态数据估计。
• =MLF 极大似然估计伴一阶衍生近似标准误和传统卡方检验。
• =MUML 有限信息参数估计。
• =WLS 加权最小二乘法估计。
• =WLSM 加权最小二乘法估计伴均值校正卡方检验。
• =WLSMV 加权最小二乘法估计使用对角加权矩阵伴均值-方差校正卡方检验。
• =ULS 非加权最小二乘法;
• =ULSMV非加权最小二乘法使用全部加权矩阵伴均值-方差校正卡方检验。
• =GLS 广义最小二乘法。
3.3.9 模型(MODEL)
主要用于对假设模型进行设定。
1)自由估计
将默认设置改成自由估计
在Mplus中执行因素分析时,为了统一测量单位,程序默认第一个条目的因子负荷为1,通过*可以将程序默认值改为自由估计。(例:F1 by y1* y2 y3 y4; )
指定开始值(例如:F1 on F2*0.1)
2)固定参数
通过使用@固定某些参数为特定的数值。(例如:F1 by y1 y2 @ 0.5 )
固定参数相等(number)
通过在变量后加(number),后面数字相等的参数被限定参数相等。(例:F1 by y1-y5(1-5)
命名参数(name)通过在变量后加(name),为参数指定标签;(例:F1 BY Y1-Y3(la1-la3))
3)MODEL模块中用于设定模型的语句:
BY 通过指标定义潜变量,By 定义测量
(例如:f1 BY y1-y5,因子f1由y1 y2 y3 y4 y5 五个外显指标测量)
ON 定义回归关系
(例如:f1 ON f2-f4; !因子f2 f3 f3三个变量预测因子f1;
f1 ON x1 x2;!观测指标x1 x2预测因子f1;
f1-f3 ON x1-x3; 等价于f1 ON x1 x2 x3; f2 ON x1 x2 x3; f3 ON x1 x2 x3;)
PON 定义配对回归关系
(例如:f1 f2 PON f3 f4等价于f1 ON f3; f2 ON f4;)
WITH 定义相关或协方差相关
(例如:f1 WITH f2; 因子f1与因子f2相关)
PWITH 定义配对相关或协方差关系
(例如:f1 f2 PWITH f3 f4; 等价于f1WITH f3;f2 WITH f4;)
MODEL INDIRECT: 描述间接效应和总效应
VIA描述一组包含特定中介变量的间接效应
VIA与IND类似,左边的为因变量,右边最后一个为自变量,右边其他变量为中介变量。VIA指定的是所有经过中介变量由自变量到因变量的间接效应。
(例如:y3 VIA y1 x1 ; 表示所有通过中介y1,自变量x1作用于因变量y3的中介效应)
CONSTRAINT模型设定命令
通过该命令可以设定模型估计参数间的线性和非线性关系。
PS: 计算描述统计量的一个例子:
Data: File is chnspress_wide.dat ;
Variable: Names are id gender bmi89 bmi91 bmi93 bmi97 bmi00 bmi04 bmi06
pre89 pre91 pre93 pre97 pre00 pre04 pre06;
Missing are all (-9999) ;
USEVARIABLES = pre89 pre91 pre93 pre97;
Model: pre89 pre91 pre93 pre97;!计算方差
[pre89 pre91 pre93 pre97](m1-m4);!计算均值
pre89 pre91 pre93 pre97 with pre89 pre91 pre93 pre97;!计算协方差
model test:
m1=m2; !m2=m3;m3=m4;
Output: standardized patterns;
结果:
3.3.10 输出(OUTPUT)
通过该命令获得模型分析结果。
在OUTPUT下,有如下几个常用的语句:
• SAMPSTAT:要求报告的样本统计量。
• CROSSTABS:提供类别变量间的交叉频率表。
• STANDARDIZED:要求提供标准化参数统计量及对应的标准误。
• RESIDUAL:要求提供观察变量的残差值。
• MODINDICES:提供模型修正指数,期望参数变化指数,和两种标准化期望参数变化等信息。
• CINTERVAL:要求报告参数置信区间值。
• TECH1-TECH14;14个技术报告
3.3.10 保存(SAVEDATA)
用于保存分析的数据以及分析的结果。
常用的保存信息命令如下:
• FILE IS newdata.dat; 指分析所用数据保存在以newdata.dat命名的文件中。
• SAMPLE IS sample.dat;样本统计量如相关、协方差矩阵保存在以sample.dat命名的文件中。
• RESULTS IS results.dat; 分析的结果被保存在以results.dat命名的文件中。
• DIFFETST IS diffetest.dat; WLSMV和MLMV估计时,嵌套模型比较的信息被保存在以diffetest.dat命名的文件中,见第九章。
• THCH3 IS tech3.dat; 技术文件3的信息被保存在以tech3.dat命名的文件中
3.3.11 绘图(PLOT)
绘图不是Mplus的强项,但依然可以通过该命令获得简单的图形。
命令如下:
TYPE IS PLOT1;获得样本的直方图,散点图和样本均值
PLOT2;提供项目特征曲线,信息曲线,EFA分析时的碎石土等。
PLOT3 潜类别条件概率。
绘图结果在模型运行结束后通过GRAPH下拉菜单的view graphs查看。
3.3.12 蒙特卡洛(MONTECARLO)
是使用Mplus做模拟研究时使用的命令。 以上内容来源:王孟成老师培训课件
声明:部分文章和信息来源于互联网,如转载内容涉及版权等问题,请立即与小编联系,我们将迅速采取适当的措施。
感谢您抽出
更多精彩请点击下列分类文章
↓↓↓
在分别时把它投掷出来是在说和不说之间的一个妥协,这样的交流可能会充满情感,所以它只能在治疗结束时被说出来,这样治疗师就没有机会来做回应了。