查看原文
其他

统计计量 | 研究生写作中变量的设计

数据Seminar 2022-12-31

本文转载自公众号经管学苑

原文出处:李怀祖等.MBA学位论文研究及写作指导[M].重庆:重庆大学出版社,2018.60-63.

Part1变量的属性设计和尺度

概念名词界定清楚之后,接下来便是变量设计,变量设计包括三项内容:操作变量设计变量的属性设计尺度选择
变量是可测的名词。一项科学研究,特别是实证研究,需要定量的数据作为分析基础,总免不了处理许多变量。有些变量如温度、日产量,可以直接测量。另一些变量,内涵虽很清晰,但直接测量有困难。例如劳动生产率这个词,概念上是国内生产总值除以职工总数,但在收集数据计算时,还会有不同理解,需要作出具体说明,如职工总数,是指在册的职工人数,还是包括临时工、合同工。“职工总数”是名义变量,而操作变量可能是“企业在册职工数”,或“在册职工加合同工总数”。
将名义变量转换成操作变量是变量设计的重要内容。如1993年颁布的《中华人民共和国教师法》规定,“教师的平均工资水平应当不低于或者高于国家公务员的平均工资水平,并逐步提高” ,但到现在还没有看到这项规定的执行情况报告,这些年教师与公务员比较起来,平均工资水平到底是高还是低,差别有多大,谁都说不清楚。究其原因,是按此规定表述的命题去测量和检验,操作有难度。“平均工资水平”是名义变量,要计算的话,还须转换成合理的操作变量,并要清晰界定每个变量的含义,如平均工资水平,是指所有教师和公务员而言,还是各类学校教师与相应类型的公务员比较。工资指基本工资还是包括绩效工资在内的实际工资,这些细节不交代清楚就无法统计。
变量必须可测。这意味着该名词(概念)的某种属性有量的差异,如“职工人数”这个变量指职工群体的数量,它的属性就是人数。“工人性别”这个变量的属性,只有男性或女性。“工人年龄”变量的属性可以设定为青年、中年、老年三种,也可以设定为18岁到60岁之间的数字。
变量是属性的集合,不同的属性要用不同的尺度来衡量属性之间的差异。“职工人数”的属性集合就是大于1的数,所用尺度是定比尺度。如“1 000人”就是表示“职工人数”的一个属性。“工人性别”的属性集合只有男、女两种,属于定类尺度变量,将工人按男或女的属性分类。“工人年龄”如设定其属性为青年中年、老年,也属于定类尺度,如设定为18到60岁,则属定比尺度。如设定“职工学历”变量,可以采用定类尺度,分本科、硕士和博士等。如需要对各种属性排出优先顺序,可采用定序尺度,例如招聘职工中按学历指标优先排序,设定为本科、高中、硕士、博士、初中,则定序尺度相应标为第一至第五。
研究工作总是离不开研究变量之间的关系,变量是可用数值来测度的名词、概念,有些变量只有两个数值,即0-1变量,如“性别”作为变量只有两个属性:“男”或“女”,炮弹的状态只有爆炸和不爆炸。当然属性也可增加,如个人所属民族,分别可用“1,2,3,4,5,..”表示“汉、回、蒙、藏....。.如表示汽车品牌,长安为1,吉利为2,捷达为3等。这些变量都属于离散型,一般不能用小数如3.2来表示。另一类变量则是连续型,如年收入、考试成绩、年龄等,可以用小数表示。
工人总数、年龄、学历这类变量和属性的测度还比较直观,可以用单项指标来完成。有些情况下变量要求用多项指标来测度,涉及多维度属性。管理研究常遇到这类变量,如满意度、凝聚力、执行力等,不像长度、年龄、重量等变量能用单一指标测度,研究者往往要设计一套多项指标来间接测度这类变量,这是管理研究的难点,但也为管理研究者提供了特有的研究空间,设计出一套有效的测度指标,就是一项研究工作结果。

Part2变量操作化过程

从假设到变量设计要经过一系列转换和细化的环节,这些环节构成了论文工作中有个人特色的实体研究内容。研究生不能忽视和轻视这个转换和细化过程,正确地完成各个环节的工作并非易事。下面举例来说明这个过程。
民间有谚语“红颜薄命”,这实际上是个假设,有人凭自己的观察和感悟提出这个论点,别人听了也觉得有道理,说得深刻,于是逐渐传播开来,但要作为科学结论,那就要论证。“红颜薄命”,按字面可以理解为“漂亮女人的命运不好”,如用假设的语言来表述,即“凡是够得上‘漂亮’的女人,命运都不好”。或者另一种表述:“女人的颜值与命运呈负相关”。不论何种解释,所研究的对象是“女人”,这个假设涉及两个变量:“颜值”和“命运”。这两个变量的属性可设置为离散型,比如,颜值的属性可以是“很漂亮、漂亮、一般、丑”;命运的属性可以是“好运、一般、薄命”。
如果属性设置为连续型,则可以按照颜值的漂亮程度和命运的好命程度用数值表示,如1...5。其中5为最漂亮,命运最好。为了实证,满足收集数据的要求,这个名义变量还须转化为可测的操作变量。尽管现实中还找不到科学仪器来测量颜值、命运,但作为科学研究,必须解决可测的问题。

这种情况下,有两种解决问题的途径。一种是逻辑推理的方法,另一种是直感判断法
逻辑推理的方法是,找不出直接测度“颜值”或“命运”的办法,就要根据“颜值”或“命运”的外延,设计出几个指标来间接测度该变量。这里引出了指标这个名词。前面提到,论点树中衍生到操作层次的论点称为操作论点,其中的变量便属操作变量。这些操作变量,有的可以直接测度,有的不行,就要寻找一组能直接测度的变量来测度它,这种可据以直接收集数据的变量,在实用中常称之为“指标”,多个或多层指标便形成“指标体系”。
设想“颜值”可转换出容貌美、体态美和风度美三个变量,这离可操作性的要求接近了一步,但还不能直接测量,于是再分解出下一级变量,如体态美分为身高、体重身高比、三围腿长身高比等。身高等这类变量可以直接测度,可称之为指标,使用这套指标就能间接地测出体态美的量化值。变量设计到这一步才算基本结束,后续工作包括操作变量属性和尺度的设定。“命运”也是类似的情况,需设计一套可供操作的指标体系。
直感判断法是找一些专家,凭直感作出颜值和好命程度的主观判断。后面问卷法一节中将要讨论,即使是主观判断,让专家回答什么问题也是大有讲究的,不能直接问:“这个人命好吗”“这个人漂亮吗”。因为回答问题的专家,对好命和漂亮的概念有不同的理解,这些直接答案缺乏可比性和一致性,从统计上来说就没有多大意义。像已经很成熟的“智商”测试问卷,不是去问当事人,“你智商如何,请从7个等级中作出选择”,设计得好的智商问卷,应让被测者意识不到这是在测试智商。直感判断法同样要设计一套类似操作指标体系的问卷。
从以上讨论可以看出,像“红颜薄命”这类常见的假设,要按科学方法论证起来,可不简单。如真的把上例作为一项研究工作来做,能将“颜值”和“命运”这两个概念的可操作性指标体系设计出来,本身也就是一项有价值的研究工作。管理研究中,往往碰到这类抽象概念,如“凝聚力”“开放度”等。所以,管理类学位论文中,从假设提出到操作变量及测量指标的设计,其间的转换和细化工作是大有文章可做的。
从名义变量转换成可测的操作变量和指标的过程,有两个问题值得注意。一是变量和属性不能混淆。属性表示变量在类型或程度上的差异,总是有伴生的可比概念,而变量是相对独立概念。比如,性别是变量,属性有“男”,还有伴生的“女”。在一篇论文中,不能将同一概念既当作变量又当作属性处理。比如文章前面设定了“颜值”为变量,“漂亮”或“很漂亮”是属性,后面就不能又将“漂亮”视为变量,并赋予一套关于漂亮的属性。不过,这种混淆变量和属性的情况在学位论文中时有发生。二是从名义变量转换到可直接测度的指标,要论证各环节的有效性,有的论文涉及名义变量如“企业创新型”“企业绩效”等,在实证测度此变量时,却简单地依靠问卷中的一个认识性问项:“你认为本企业的创新性(绩效)属于:很强(很好) ,强(好),一般,差,很差。”面对这样的问题和选项,企业职工只能凭借个人印象给出答案。这些答案汇集成的数据,其有效性就难以令人信服。





星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧


往期推荐


数据资源 | 国内学术数据资源网站汇总——报刊篇

数据可视化 | 配色八项原则

数据资源 | 企研·学术大数据平台开放试用申请!

统计计量 | Breiman访谈录:《统计建模:两种文化》20周年纪念

数据资源 | 气候生态类数据资源探索

统计计量 | 选择性偏差与内生性问题是一回事儿吗?

CCAD2021招聘 | 听说这是你想要的另一种生活






数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


推荐 | 青酱


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存