查看原文
其他

城读│怎样用地图撒谎

2015-04-24 马克•蒙莫尼尔 城读


23

怎样用地图撒谎?


本书讨论了地图可能存在的各种撒谎方式,培养一种对待地图的健康的怀疑意识。



马克·蒙莫尼尔著,黄义军译,会撒谎的地图,商务印书馆,2012

Source: http://book.douban.com/subject/6875226/


用地图来撒谎,不仅容易,而且不可避免。在一张白纸或投影屏幕上表现复杂的三维世界中存在的意义丰富的要素关系,地图一定会扭曲现实。地图制作的悖论:一方面要为读者提供真实有用的画面;另一方面,一幅地图内容再精确,也一定会说一些非恶意的小谎言。


使地图遭受损害的潜在因素很多,远不止政客式制图者的蓄意隐瞒或不懂制图原理的人使用电脑软件造成的失误。如果用一句话告诫地图用户,那就是:单幅地图只是适用于相同环境或采用同一套数据制作的无数地图中一幅。


本书的目的在于培养一种对待地图的健康的怀疑意识,而不是唆使人们完全不相信地图或用地图弄虚作假。地图与演讲、绘画一样,是由作者搜集处理信息的,因此,这一过程不可避免存在因无知、贪婪、思维盲点或恶意而造成的歪曲失真。



地图的基本要素



地图有三个基本要素:比例尺、投影和符号(scale,projections and symbol)。每个要素都是造成失真的潜在因素。


比例尺用三种形式呈现:文字、比率和图示。相对大比例尺地图,小比例尺地图说谎的可能性更大。



图1 比例尺类型



地图投影是将一个三维曲面即地球球面转换到一个二维平面上,这个转换过程会使地图比例尺产生变形。


地图投影分为两步:第一步,将地球缩小为地球仪,比例尺在每个地点和所有方向都保持不变。第二步,将地球仪的符号投影到可展面,如平面、圆锥和圆柱上,这些曲面与地球仪相交于一个切点、一条标准线或两条标准线。在最后生成的平面地图上,比例尺只在这些标准线上保持不变。距离标准线越远,比例尺变形越大。


制图者借助常见的可展面——平面、圆锥和圆柱,将投影集中或接近于地图表现的区域,以最大限度减小变形,世界地图常采用以赤道为中心的圆柱投影。圆锥投影适合大面积的中纬度地区,比如北美、欧洲和前苏联。割圆锥投影比切圆锥投影平均失真少。方位角投影,以平面作为可展面,在极地地图上使用最多。


对于每一种可展面,制图者还可以选择不同的投影方式,每一种投影都有各自的变形模式。等面积投影保持投影前后面积不变;等角投影,或正形投影(conformal projection)保持投影前后角度不变。一般而言,等角投影比非等角投影产生的轮廓变形相对要小。



图2 地图投影第二步的可展面




图3 割圆柱投影(上)和切圆柱投影(下)


地图投影会使五种地理关系发生畸变:面积、角度、轮廓、距离和方向。


没有那种地图能像地球仪一样,保持面积、角度、形状、距离、方向不发生变形,所有地图都是折中解决方案的产物。投影最棘手的问题就是兼顾正形与等价,没有一种投影能同时做到保持形状与面积不变,这两种属性互相排斥。


地图符号通过可视化地图要素、地点和其他区位信息,对地图比例尺和投影进行补充。地图符号有三类几何形地图符号和六类视觉变量。


几何形地图符号包括点状符号、线状符号和面状符号。点状符号标记地标或村庄的位置,线状符号表现河流或道路的长度或形状,面状符号描述国家公园或城市的形状或大小。


地图符号存在六种视觉变量:尺寸、形状、灰调值(greytone value)、纹理(texture)、方向(orientation)与色调(hue)。形状、纹理和色调适于表现土地利用等定性差异。尺寸符号适于表现定量差异。灰调值是描述比率和密度差异的首选符号。可变换方向的符号多用来表现气流、移民流动等方向性事件。




图4 六种基本的视觉变量







地图的白色谎言



一副好的地图会讲许多白色谎言,隐瞒某些事实以帮助读者看到他们想看到的内容。现实是三维的,无法完全再现于二维图形中。若不对现实进行概括和综合,地图将一无所用。地图的价值在于,经概括的几何图形与内容,是否较好地反映了地图作者选取的现实内容。


地图概括包括几何概括和内容概括。





几何概括



几何概括追求图形清晰,避免符号重叠。几何概括来自地图清晰性的要求,因为地图符号往往要比它们表现的要素在地图上多占空间。点、线、面状符号要求不同类型的概括。


点状符号概括需要通过选取和位移避免与相邻符号重叠,出现图形干扰。某个记号被位移,远离标识的要素时,需要用图形关联(graphic association),用线条或数字代号把标记和说明连接起来。缩略语则是另一种要素密集的小比例尺地图标记的重要手段。许多相同的要素可能需要合并。



图5 点状要素和地图标记概括的基本几何处理


线状符号有5种基本概括过程:选取、化简、位移、平滑和增强。



图6 线状要素概括的基本几何处理


面状符号需要的概括形式最多,除了线状符号的5种概括过程,还有几种专门用于面状要素的操作:合并、融合、分割、点转换、线转换。



图7 面状要素概括的几种基本几何处理


符合标准的地图只能表现平面距离,通过把每个点垂直投影到水平面,三维的陆地表面被压缩到二维的地图,就是平面地图。对处在不同高程的两个点,地图上水平精确位置之间的距离,小于两点之间地形面的距离,也小于三维空间中两点的直线距离。但平面距离是制作大比例平面地图必不可少的几何概括方式。


对于某些地图而言,几何精度不如联结(linkage)、毗邻和相对位置重要。例如地铁图是一种高度概括的地图,中心城区比例尺较大,而城市外围的比例尺较小。





内容概括



内容概括通过滤除与地图功能和主题不相关的细节,使地图的用途与意义更明确。内容概括有两个基本要素:选取与分组。内容选取只选择与地图主要内容相关的要素。分组则通过辨析所选要素的相似之处,采用某个特定符号代表一群类似要素。


地图内容概括存在个人取舍、价值观和偏向。分级统计图是一种描述地域单元地理布局的地图。不同的分级方式导致对地理现象截然不同的判读。如下两图的教训:第一,一幅分级统计图只是某种地理变量可能生成的许多种视图中一种。第二,地图概括中非恶意的谎言可能会掩盖政治宣传家的真实谎言。



图8 采用不同的系列级差后,同一套数据可生成不同的分级统计图




图9 以人为选择的级差生成的分级统计图可用于表达不同政见


读地图时必须记住,对现实的观察有许多种,一种特定的观察并不是唯一的观察,而且还不一定就是接近真实的有效观察。




怎样用地图投影撒谎?



一些地图投影方法可以帮助宣传家把某些小地区放大或使某些大地区变得更大。例如,墨卡托投影(Mercator)是专为协助航海者设计的,这种投影方法可以使等角航线成为一条直线,但却使面积产生变形,尤其是靠近两级地区,这种投影法几乎没法表现北极圈和南极圈区域,使两级和赤道之间距离变得无限远。


对共产主义和斯大林主义感到恐惧的约翰·伯奇协会和其他政治团体,曾用墨卡托世界地图,把前苏联和中国印刷成刺眼的、象征性的大红色,以此夸大共产主义国家的威胁。



图10 墨卡托投影被政治宣传家用来夸大共产主义的威胁,中国、尤其是前苏联的面积被夸大


1970年代,德国历史学家亚诺·彼得斯(Arno Peters)发表基于等积投影的”新的”世界地图,批评墨卡托投影对大多数第三世界国家的轻描淡写。彼得斯的等积投影方式与1855年苏格兰牧师詹姆斯·高尔(James Gall)投影类似,这种投影应称为“高尔—彼得斯投影”。




图11 彼得斯投影,确切地说,高尔—彼得斯投影



彼得斯谴责墨卡托的世界观,兜售自己的投影“忠实于面积”,更加精确、更加平等地表现地球,受到宗教界和联合国组织的强烈欢迎,他们出版了大大小小的彼得斯投影地图。


彼得斯投影使热带大陆略微变小并呈拉伸状,因此学院派地图学者并不青睐,而接受较之更为合理的其他等积地图。美国地图专家约翰·施耐德(John Snyder)拿出一种风趣的等积投影来支持地图界同行的观点,即等积地图并不一定就是好地图。如图,施耐德的沙漏状等积投影正是彼得斯做过而墨卡托没做过的——这种投影保留了面积关系,但也形象地说明,忠实于面积并不等于忠实于形状。




图12 约翰·施耐德设计的沙漏式等积投影(hourglass equal-area projection),与所有等积投影一样,忠实于面积但会扭曲形状



但讽刺的是,联合国教科文组织和其他对第三世界问题敏感的组织,还是支持彼得斯这种错误的投影方式。


地图可好可坏,取决于谁掌控它们,使用地图目的何在,地图怎样被使用和为啥这样使用。





怎样用数据地图说谎?



同一套数据,可能生成显著不同的地图。不同级别空间区域合并可以产生完全不同的空间布局;不同的数据分级可以创造出截然不同的空间布局。所以,单幅地图只是出自同一套资料的多幅地图中的一幅而已。


制图者和读图者须知,基于人口普查数据的地图如何在提供有用信息的同时,也可能公然歪曲事实。



区域合并(area aggregation)对地图布局的影响


用不同的区域合并方式处理数据,可能生成截然不同的布局或关系,因此,制图者应该陈述所采用的地理单元类型,对每一种描述或判读作出界定。例如在县级单位的地理分布,与州/省级单位的地理分布可能不一样。


区域合并对表现比率或比例的地图布局产生显著影响。例如,分别以县和组成县的镇为单元进行数据合并,得到的户均电视机比率会生成明显不同的地图布局(如下图所示)。




图13 上方左侧是假定的28个镇的电视机数量统计,右侧则是住户数量,下方是户均拥有电视机数量




图14 以上图28个镇所属的3个县为单位合并统计的电视机数量(左)、户数(中)、户均拥有电视机数量(右)


不同的区域合并方式影响地理布局。上述例子用不同的方式把镇组合为县,产生显著不同的县级布局。因此,清晰地表述所采用的数据单元非常重要,在一个汇总层级中表现出的空间模式,未必会在另一个汇总层级中出现。




图15 以其他方式将28个镇合并为县后制成的县级单元数据表



此外,要防止出现生态谬误:从一种基于区域单元的空间布局,得出关于单个住户的结论。关于一个地方的平均数据,并不能反映单个居民的情况。


综上,制图者必须了解统计区域和数据,用不同层级的合并方式测试这些数据,并对所有结论作出仔细的界定。而好怀疑的读图者需要查阅和对比不同层级的地图,防止有人对地图做手脚,挑选最能证明其观点的合并层级自圆其说。



数据分类(data classification)对地图布局的影响



数据分类不当可能产生使空间趋势失真的空间布局:任意选取的分类级差可能将原本清晰连贯的变化趋势,淹没于过于破碎的视图中;或用平滑的视图使原本意义丰富、错综复杂的布局趋于简单化。


地图软件常见的默认数据分类包括等距分级(equal-intervals scheme)和四分位分级(quartile scheme)。等距分级优点是易于计算,如果数据均匀分布,可以采用这种方案,若数据并非均匀分布,某些数据分类项会出现空缺。


四分位分级能使所有的4类地区占有相同数目的区域单位,如果地区数目不是4的整数,就只能获得大体上的平衡。这种地图布局比较具有视觉平衡感,对于关注处于数据值中最高和最低的四分位的区域分布的人而言,这种分级方法比较适合。




图16 同一组数据的不同分类:等距分级(左)和四分位分级分级(右)


数据分级的步骤:1)数据如何在值域范围内分布?2)如果有级差,选择怎样的级差分类有意义?


第二个问题的答案取决于数据本身,也取决于制图者是否要与全国或地区的平均水平作比较。为了找出有意义的级差分类,可以画一条数值分布的数轴,一个点代表一个数据值,相同的数据标于同一刻度上方。生成的数轴使数据值分布清晰可见,从中选择合适的级数,并在合适的位置确定分级断限:可能有自然断限;相近的数据会形成明显的丛集,它们不需要另行分级。


但是,如何处理数据分布中明显孤立的极高值或极低值?究竟应该把这些异常值与数轴上大于或小于它们、同质性明显更强的数据集群划为一群,还是让它们自成一类?甚至删除?


没有统一答案。制图者应该了解数据,判断异常值究竟真实还是不可靠,判断异常值较大的落差是否有意义,看异常值与地图主题、读者兴趣的关系。下图户均电视数量分布,户均8.9是个异常值,如果数据无误,应该专设一个类别。



图17 户均电视数量的数轴




数据分级与相关性



不同的数据分级可能使地理分布发生变形,可以使基本相同的趋势看起来很不同;或者使迥异的空间布局看起来貌似相同。


如果两幅地图中颜色最深、最吸引眼球的符号分布位置相同,缺乏经验的读者会误以为两幅地图是相似的。绝不要单凭空间布局的相似来判断数量相关。



图18 有着相同布局的户均电视数量与户均儿童数量的分级统计图



图19 两幅明显不同的分级统计图表面,电视机拥有率与家庭规模之间的相关性极低




图20 大区域的相似性掩盖了小区域之间的显著差别,使人们对两幅地图相关性的视觉估测失真。



为避免根据区域单元面积对相关性做出片面估计,分析人员应做散点图加以审视。散点图可以快速揭示变量关系:是线性相关还是曲线相关,相关关系强弱,异常值。但是散点图不能给出精确的相关性大小。



图21


各种相关类型的散点图和趋势线(从上到下、从左至右依次为):强正向线性相关、中正向线性相关、弱正向线性相关、中负向线性相关、无明显相关和强曲线相关或中线性相关


相关系数可以度量线性相关的强度和方向,值域从+1到-1,接近0时表示相关性不确定或微弱。相关系数只能衡量变量关系,不能说明原因,必须依赖逻辑和证据。


制图者必须同时利用地图、散点图和相关关系来分析,三者互相补充。相关关系提供一对变量的简明对比,只能测量线性相关性,散点图能快速揭示强曲线关系,但不长于比较相关性强度。相关关系和散点图不能告诉地方区位,而地图虽然能展示空间走势,对相关性估计却不大可靠。


地图可以表现地理相关(空间相关),但是它不同于散点图和相关关系体现的统计相关。统计相关是非空间的,不能揭示任何空间趋势。下图说明两者的差异,相同的散点图与相关系数却对应着不同的地图布局。变量A和B的布局都比较混乱零碎,明显不同于变量X和Y体现的地理相关。




图22 有着相同散点图、相关系数和级差的两对变量,其地理分布却明显不同



通常,地图作者脑子里都会有一个先入为主的主题,同时还有几个可供选择的变量。一般来说,某些变量表现出来的基调或布局比另一些变量乐观,而且指数名称也会给地图标题带来有利或不利的印象。比如“劳动参与”听起来较乐观,而“失业”显然较悲观。


当单一变量可能生成多种不同地图时,哪一种是正确的?不仅要提防地图造假者,还要留心那些不知道合并与分级后果的粗心的地图作者




结论

本书讨论了地图可能存在的各种撒谎方式:为什么地图必须撒一些无恶意的小谎,人们如何利用地图故意撒谎,为什么当善意的地图作者不理解地图概括和图形原理时,常常会使地图歪曲事实?因此,明智的地图用户应该具有怀疑精神,提高对地图作者专业技能与制图动机的批判能力,警惕由于地图作者的无知或恶意造成的失真,避免受到误导。但是,地图存在的扭曲事实和误导读者的可能,并不妨碍我们评价地图探索和解释地理事实的能力。地图的抽象过程既让我们付出代价,也得到收益。如果不服务于知识和诚信的目的,地图的力量可能会失去控制。





关注我们!
微信公共订阅账号“城读”,每周推送城市阅读笔记。关注我们,请搜索账号 CityReads,或扫描下方的二维码:
微信号:CityReads


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存