查看原文
其他

【学术随笔】潘绥铭:美国大选的预测是怎么失误的? ——问卷调查应该如何测量“主体建构”

2016-11-14 潘绥铭 性研究ing
作者简介潘绥铭:中国人民大学性社会学研究所荣誉所长、社会学系教授、博士生导师


这次美国大选之前的民意调查,普遍出现了失误。极少有调查预测到川普的当选。对此,舆论议论纷纷,莫衷一是。
在愤怒声讨的大潮中,有一些说法非常浅薄,却可以大行其道。例如有人彻底否定民意调查的随机抽样方法,说是民调结果缺乏整体代表性。这种说法其实是逻辑的自相矛盾:民意调查一直采用相同的随机抽样方法,那么,为什么以前的调查结果基本都是正确的,偏偏这一次失误了呢?
与此类似的说法是:选民的情绪(投票结果)战胜了理性(民调数据)。可是这也有逻辑的矛盾:难道他们就不能“要情绪全是情绪,要理性全是理性”吗?
还有人认为,这次民调的主持人大多数都是支持希拉里的,因此误导了调查结果。这种可能性虽然确实存在,但是美国的民意调查持续了数十年,数不清的机构做过无数次调查,如果没有过硬的和充足的证据,那么民意调查的客观性是很难被质疑的。
我觉得最靠谱的分析是:有相当一部分被调查者隐瞒了或者扭曲了自己真实的投票意向,或者并没有深思熟虑和通盘考虑。尤其在那些“摇摆州”里,这种情况很可能更多,才会形成“翻盘”。这个猜测对不对,只需要一次选举后的追加调查,就可以得到验证。
如果我们把这种“曲答”作为假设,那么接下来的分析就必然走向两个方向:
其一,在选举之前的“政治正确”的大气候下,相当多的被调查者,是不是不愿表达相反的投票意愿,因此才“曲答”?[1]
其二,无论是否出现这种情况,调查主持人有没有什么技术手段来剔除或修正这种“曲答”呢?[2]
这两种分析方向,无论哪一个,都可以做成长篇大论的专业论文,都有助于促进社会调查方法论的发展。但是我在这里想说的,却是另外一种更为根本的视角和思路:
在问卷调查中,我们应该如何测量被调查者的“主体建构”?
“主体建构的研究视角”是我和黄盈盈在2007年提出的一种思路 [3],随着不断的应用研究 [4],完善于2015年 [5]。对于本文而言,它的主要意思是:
社会学的一切问卷调查的元假设都是:我们可以通过种种技术手段来“客观地测量”人类的社会活动;却往往忽视了另外一个元假设:我们所获得的一切信息都依赖于对方的“主诉”而不是“监测”;而对方的主诉则是他们在特定的时空与情境中,自己建构出来而且被动表述的,而不是某种“客观存在”。也就是说,问卷调查的“信息源”其实就不一定是“客观的”。
这种“主体建构”当然包括被调查者的故意撒谎,但是更主要的却是那些浅意识或无意识的方面:主体对于“提问”的含义具有不同的理解和不同的情绪反应、主体对于自己应该如何回答提问,也具有不同的“自律”、主体在不同程度和不同方向上,具有不同的表述能力、主体在此时此处此情此景之中会“临场发挥”或“灵机一动”等等,不一而足。
上述情况,其实是普通人在日常生活中的常识,只不过因为没有被学术化,所以念书念出来的学者们反而不知道或者不愿意承认。
美国大选的预测,尤其是在那些“摇摆州”里,很可能由于是高度简化的问卷,无法包括上述这些内容,也就无法调查到人们的“主体建构”,因此才会出现失误。
可惜,在迄今为止的问卷调查中,上述“主体建构”的方方面面,仍然没有被足够地纳入考虑。虽然问卷调查的主持人都会贯彻“充分动员”、“价值中立”、“照本宣科”等原则,以便防止诱导或歧义等人为偏差;但是这些都仅仅局限在现场操作的环节中,仍然缺乏从问卷设计的原点来考虑。也就是说,调查主持人在生产调查问卷的时候,还没有充分地认识到:自己必须设计出某些足以让被调查者充分呈现自己的“主体建构”的内容。
这种“呈现主体建构”的问卷设计,绝对不等于“测谎”设计。前者的目标是扩展地收集新的信息,后者却是在已经获得的信息里进行筛除;前者是给被调查者提供自由表达的机会,后者却是按照问卷设计者或数据清理者自己的逻辑,来故意裁剪生活。我自己早年曾经断言:“无测谎,不调查”。后来才逐渐明白测谎与主体呈现之间的原则差别)
总之,问卷调查不仅仅需要筛除错误信息,更加需要使用一套合适的技术手段,给被调查者提供充分的空间,让他们尽可能多地表达出:在面对某个提问的时候,自己究竟是考虑到哪些其他因素、按照自己什么样的逻辑、怎样最终选择了回答什么。
唯有如此,问卷调查才能从“测量客观存在”的浅层次,发展为“理解人的选择”的更高层次,才能促进问卷调查在当今充满不确定性的现实生活中,不再固步自封而是日新月异。 那么,具体应该如何操作呢?
估计很多人马上就会想到设置“开放题”。可是我已经在前此的论文中分析过,这其实是一种失误。因为开放题所获得的定性资料无法与问卷调查获得的定量数据共同进行统计。[6]
其实,解决之道恰恰在于充分贯彻一切社会研究的核心:进行“相关假设的设计”
以美国大选的民意调查为例,“你选谁”当然是中心问题,但是不能仅仅把那些最基本的社会特征(年龄、性别、种族、文化程度等等)作为“天然的自变量”,来分析它们与“选谁”之间的关系(可惜,他们恰恰就是这样做的);还必须特意地假设出一些与“选谁”存在密切关系的其他提问,然后进行相关分析,才能更加准确地做出“选谁”的预测。例如,可以把希拉里和川普的不同主张、不同媒体形象、不同个人气质、不同生活经历这些方面,分别地罗列出来,分别地询问被调查者的喜好程度。这样,我们就可以分析出被调查者在“选谁”这个问题上的“喜好结构”,也就是假设和检验他们在诸多的影响因素中,最可能根据什么来决定自己的最终选择。在足够大的随机抽样样本中,通过各种分层的对照分析,我们就可以更加准确地判断出,究竟哪些被调查者的选择是坚定不移的,哪些人则是游移不定甚至口是心非。这就可以给最终的预测结果加上一些“可变度”参数,从而使得预测更加有效。
进一步看,最好能够在每一个分别提问的后面,再追加一些提问,例如:被调查者回答这个提问的敏感程度、对这个提问的理解程度、他们的表述能力的程度、这个提问所引发的联想的分类内容等等;甚至还可以直接采用某些心理测量的提问。这样,我们就不仅仅可以知道被调查者如何做出选择,更可以知道他们究竟怎样做出选择,从而使得预测结果更加具有弹性,才可能更好地应对“不确定性剧增”这一生活现实。
当然,这样理想化的问卷设计,必须依托于大量坚实的研究基础。首先需要拥有和消化足够多和足够好的此前调查结果;其次要能够提出贴切和精细的假设;第三必须设计出相应的检验手段及其判定标准。
凡此种种,其实在任何一个合格的社会学研究中都已经做到了。即使在问卷调查蹒跚学步的现今中国,这样的“社会学学术调查”也已经不胜枚举。因此问题仅仅在于,即使在那些必须“短平快”的民意调查中,我们也绝不能再满足于那些单变量的调查、仅仅获得百分比的调查、仅仅具有“天然自变量”的调查。我们必须认真贯彻社会学学术调查那种多侧面、多层次和多元视角的相关假设的设计或者反过来说,自从美国大选预测失误之后,那些没有假设和相关设计的简单调查已经声名狼藉,开始日薄西山了。
当然,具有相关设计的问卷调查再好,由于它必然会是题量庞大,如果没有最便捷的调查手段,也只能是纸上谈兵。可是,互联网和多媒体技术的普及,已经给我们提供了全新的最高效的调查手段。那就是:在随机抽样的现场实地,调查员与被调查者面对面,通过“图、文、音、像并茂”的问卷和“触摸、语音、凝视相结合”的选答方式,使用手机上网来自主回答。我所主持的2015年第四次全国总人口的性调查,虽然最多可以有192个提问,但是由于运用了上述的一部分新技术,就极大地缩短了回答时间,而且保证了与前三次调查基本持平的很高的应答率。 最后我必须说一个相关的话题。社会学学术调查的这种“假设-检验的相关设计”,与当前甚嚣尘上的“大数据崇拜”具有本质区别,而且水火不容。
前者是遵循自然科学中“可控条件下的可重复的实验”这个金科玉律,其关键则是必须先有一个假设,然后再调查(收集数据),才能进行检验,才能确认调查结果的信度和效度(真实性与可重复性),才能形成正确的认知。因此,社会学的学术调查,至少在主观上是努力去“仿科学”的。
可是“大数据崇拜者们”,能够说清楚自己的方法论吗?它其实就是无假设、无可控条件的“大海捞针”。大数据之所以能够被分析,全靠“事后假设”,也就是盲目地收集漫无边际的数据之后,再“瞎猫碰上死耗子”地寻找相关关系;万一找到了,就可以出成果。(可惜,相当多的大数据崇拜者,其实连这个分析方法也不知道。)可是,这究竟是科学研究还是撞大运呢?如果这是好办法,那么人类为什么还要花费数百年时间来发展自然科学呢?
当然,如果大数据分析真的可以创造出某些新的方法论,那么任何人都会乐见其成、共享其乐。我所反对的,其实仅仅是盲目崇拜和拒不反思。
尤其是,很多“大数据崇拜者”根本不知道“主体建构”这种研究视角,错误地认为“痕迹监测”就必然反映出人类这个主体的一切建构。说白了,就是依然把人类当作实验用的小白鼠。结果,大数据崇拜就必然构建出一个连自己都会掉进去的陷阱。或者反过来说,无论“大数据崇拜”如何称王称霸,都无法撼动社会学学术调查的价值与地位。
最雄辩的事实就是:正是因为没有假设也没有可控条件,因此使用大数据或人工智能进行大选结果预测的至少6个机构,全都失误了,甚至更加失误;数据再大也没用!
反之,美国民调为什么不用淘宝网来预测?难道淘宝网的数据还不够大?就是因为存在着一个假设和一个条件:淘宝网的使用者,基本上都没有美国的投票权啊!
让我们一起牢记吧:假设是一切科学化的研究的开始;相关设计才是要研究的“真问题”;好的假设(1%的灵感)大于其余99%的汗水!
END

References

[1] 对此,我曾经分析过:发对性骚扰的强大舆论,显著地作用于“被性骚扰恐惧”的实际发生率。参见黄盈盈、潘绥铭:《21世纪中国性骚扰:话语介入与主体建构之悖》,《探索与争鸣》2013年7期。

[2] 对此,可参见潘绥铭、黄盈盈:《论方法:社会学调查的本土实践与升华》中关于“测谎”的论述。中国人民大学出版社,2011年9月。

[3] 潘绥铭、黄盈盈:《“主体建构”:性社会学研究视角的革命及本土发展空间》,《社会学研究》,2007年第3期。

[4] 黄盈盈、潘绥铭:《问卷调查的“过程控制”:论主体构建视角下调查方法的整合》,《社会科学战线》2010第3期。 姚星亮、黄盈盈、潘绥铭:《主体建构理论及其一般机制--基于“提供性服务歌厅”老板言及“小姐”时自我呈现的社区考察》,《妇女研究论丛》2012年9月第5期。潘绥铭、侯荣庭:《21世纪中国的“亲密消费”:国家法理与民间信念的互构》,《云南师范大学学报》2014年第1期。

[5] 潘绥铭、鲍雨:《论“主体建构”的认识论来源及理论意义》,《学术界》2015年第2期。[6] 潘绥铭:《问卷调查:设置“开放题”是一种失误》,《社会科学研究》,2008年5月。
性研究ing你想要的性研究都在这里
长按并识别二维码关注我们

本公众号所有原创文章归中国人民大学性社会学研究所版权所有任何组织、机构和个人不得擅自修改并转载转载请联系本公众号


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存