查看原文
其他

医学研究中统计图形的构成要素和设计要点

The following article is from 中华流行病学杂志 Author 中华流行病学杂志

点击蓝字

关注我们

引用格式:张隆垚,林云志,黄丽红,等.医学研究中统计图形的构成要素和设计要点[J].中华流行病学杂志,2023,44(11):1815-1819.DOI:10.3760/cma.j.cn112338-20230410-00224

作者:张隆垚,林云志,黄丽红,陈峰,魏永越

摘  要

统计图形作为医学研究结果可视化的重要方法,可清晰地展示研究结果和重点。然而,如何设计一幅好的统计图形,目前国内外尚无权威且统一的原则,且对于统计图形设计原则缺乏认识,可能会掩盖成果亮点甚至曲解研究结果。鉴于此,本文结合实例,阐述统计图形的构成要素和设计原则,供国内医学研究者参考。



【关键词】医学研究;统计图形;基本要素;设计要点;复合图形             



背  景


统计图形是数据可视化的重要手段,可显著提高研究论文的可读性和吸引力,引导读者快速领会统计数据所蕴含的规律。当前医学权威期刊对于图形的要求仅限于技术参数,缺乏较为具体的医学统计图形设计要求。继医学研究中的统计图形规范一文后[1],笔者以统计图形构成要素和设计要点为主题,总结医学研究中统计图形的基本要素、设计原则和美化建议,供医学研究者参考。




1.

统计图形的基本要素:


一幅完整的统计图形,包括6个部分(图 1):

1)图题:

即统计图的标题,用简明扼要的文字说明统计图所要传达的主要内容[2]


2)坐标:

在二维平面图形中,坐标系默认采用笛卡尔坐标系,并以数据的原始尺度绘制图形[3]。坐标轴范围通常在值域基础上适当放大(如5%~10%),不可比实际数据的值域小,导致部分数据无法显示,亦不可过大,导致绘图区域利用率过低。坐标刻度的疏密可根据画幅大小适度调整,数据点较密时可采用加有标签说明的主次刻度。根据实际需要可对坐标尺度施以对数、开方等函数变换。


3)标目:

即坐标轴标题,通常用简洁准确的文字说明横轴和纵轴所代表的数据含义,常用变量名称及其计量单位表示[4]


4)图体:

是统计图形中最核心的部分,通常由点、线、矩形等几何图形构成。根据变量特点(实际数值或者变量的统计量),将其映射至几何图形的大小、长度、形状、颜色、透明度等元素特征中[5]


5)图例:

即对图中各种点、线、块、颜色等做简要注释,让读者理解图中各几何图形含义,从而更快地接受图形传达的信息。根据整体构图,可置于图形上方、侧面或图体空白处。


(6)图注:

统计图形应有一定的自明性。图注通常指对图形的研究背景、数据特征、分析方法、主要结果、缩写的简要注释,以便于读者在不参考其他资料的前提下,能够读懂图形,抓住重点[6]


2.

绘图的一般原则:

制作一幅恰当的统计图形需要遵循的一般性原则:


1)数据准确:

统计图形基于统计资料,数据的严谨性和正确性是一幅统计图形的灵魂。


2)内容简要:

一幅图形阐明一个结果(或规律)即可,少则聚,多则散,内容过多将会分散图形的焦点[7-8]


3)主次分明:

突出图形的中心思想,可通过调整图体中几何图形的大小(点的大小或线的粗细和样式),或设置具有强对比度的颜色,辅以指导线或注释文字,弱化其他区域的非主导元素,构造视觉焦点,吸引读者注意力[9-10]


3.

统计图形的设计原则:

格式塔原则(Gestalt Principles)是视觉心理学中的经典原则[11-12],其观点为人们能够通过视觉活动,将观察到的对象加以简化、组合、抽象以及分离,如人们观察到各种颜色时,往往会联想到具体的与之有关的事物。基于这种原则,将其应用于图形设计过程中可赋予图形艺术性和视觉效果。

格式塔原则包括7项:


1)简单性:

人的知觉对图形具有简化的功能,如同Cleveland[13]的观点:点相对于线、条形等元素更简单,更易吸引注意( 2A)。

2)相似性:

对于同类或相关性很强的资料,可在几何图形元素空间位置上设置相近或设置相同的形状或颜色。如 2B,以不同形状、不同颜色的散点区分不同属性的数据,展示更富逻辑。


3)对称性:

人们观察事物过程中,更倾向于简单且对称的图形( 2C)。


4)连续性:

在展示趋势性特征时,考虑到视觉惯性,常选择连续形式的图体元素,如 2D,两组散点在平面上的排列,以直线相连展示其连续性趋势,更加直观。


5)邻近性:

在二维平面或三维空间内,位置邻近的物体更易被视为一体,见 2E,人们通常第一印象会认为是3组球,而不是6个独立的球。


6)闭合性:

又称为完形原则,人们在观察熟悉的视觉形象时,倾向于将不完整的局部形象自行补充为一个整体的形象。如不完整的两个环形排列,观察时会自补齐为圆形,见 2F。卡尼萨三角形作为格式塔原则的著名代表图形[14],几个豆状图形排列,形成中间的空白域,实际图形中并未绘制三角形边线,但人眼观察时,会将不完整的局部形象补全,自动捕捉到中间的三角形。


7)图片与背景的对比:

利用主从关系,强调对比,设置不同的图体与背景颜色,如对比色(黑白、红蓝等),以留白等方式突出主体形象。如以黑色为背景色,白色的主题字样更加清晰,见 2G


格式塔7项原则相辅相成、密不可分,在其基础上设计出符合人群视觉特点的图形,使人们产生对图形的共鸣,才是统计图形的艺术性的体现。


4.

统计图形的形式变换:

艺术性是图形的生命[15]。通过对图形进行变换,可提升其视觉冲击力,更准确地表达数据蕴含的规律和想要传递给读者的关键信息。图形变换具有多种方式,例如:


1)条形图的极坐标变换:

条形图经极坐标变换后,将条形不同高度转化为饼图不同扇形角度,以各角度的大小体现数值大小;以此为基础,结合条形图、饼图特点,设置相同的扇形角度,用扇形的半径长度代替数值的大小,衍生为著名的玫瑰图。以2016年中国癌症死亡人数数据为例,展示条形图-饼图的极坐标变化( 3A),图形变换后,可清楚观察到死亡人数排名靠前的癌症(肺癌、肝癌和胃癌),对视觉产生更大的吸引力[16]

2)线图的极坐标变换:

将线图的横轴进行极坐标变换,形似雷达屏显,即为雷达图。如 3B,以5个模型在不同验证数据集下的曲线下面积(AUC)为例,分别绘制线图和雷达图,线图中以线条围成的面积比较AUC大小,转化为雷达图后,以不同顶点所处位置来判断模型AUC大小,由图可见模型4表现最佳,模型1表现最差。


3)直方图的阿基米德螺旋坐标变换:

螺旋直方图基于阿基米德螺旋坐标系,常用于绘制时间序列数据,用来展示数据的周期性或变化趋势,以2017-2020年某城市每日平均PM2.5浓度变化为例,图形变化后,螺旋直方图由内至外,顺时针旋转一周即为一年,可对比不同年份同一时期的数据差异,数据变化趋势更加直观,艺术性和可读性大大提升。见 3C



5.

图形的美化:

图形的美化基于视觉语言的完美传达,其中色彩、质感、空间均是可考虑的元素,可从几个方面来美化:


1)图形比例:

艺术设计领域默认宽高比为43,符合黄金分割比例,视觉效果较好。科学出版物中,应根据图形类别而定,如:饼图建议用11的画幅,横和纵轴尺度范围相同的散点图和线图推荐11的画幅;若横轴范围较大,则可用64107甚至64274333)的宽幅[17]


2)图形色彩:

在平面设计中,色彩起着强化主题的作用。简要的数据,可以用单色呈现;同一类别而程度有别的数据,可以用同一色系的渐变色来呈现;若含有不同类别的数据,则建议用彩色呈现。色彩有主次之分,画面基调采用次要色彩,焦点几何图形元素或结果采用主体色彩。一幅图形中尽量不超过3种色系[18]


3)图形主题:

统一的图形背景,协调的标签字体字号,统一的坐标轴、参考线粗细,重点突出的几何图形,主次分明的色彩搭配,构成了一幅图的设计主题。形和色的完美搭配,方能呈现图形之美。


6.

复合统计图形:

一项医学研究,可产生各类丰富的分析结果。往往单一图形展示效果有限,以图层叠加多种统计图形是常用的方法。例如:通过设置左右双纵坐标轴,将两个图形融合,在共同横轴数据上相互比较不同类别纵轴指标( 4A);多个图共用纵坐标轴,以便于横轴所示指标的相互比较( 4B);将画布网格化,每一区域可分配不同的比例,放置不同的图形,多图拼接,以全面展示数据特征( 4C);多个子图的拼装形成集成统计图形,子图内容应具有一定联系,以更为全面地展示分析结果( 4D)。

不同复合统计图形,在设计上需注意:


1)风格一致:

不同子图图体的类别、色系、背景特点、标签字体和字号等设计风格需保持一致;多个子图的排列要考虑图形在报告中的排版形式,轮廓对齐,宽高比尽量符合设计美学要求。在各子图同一个相对位置上(正上方或左上角)用等序号标识,以便于文中引用。


2)去冗求精:

若有共同的几何图形的图例、文字标注或注释,切勿重复,可抽提置于整个复合图形的上方、右侧或图体的空白区域[19]


3)排列有序:

多幅子图排列时,顺序应有一定逻辑,可按结果的重要程度进行排序。


4)直观和精确兼顾:

图形可结合表格共同展示,图形的优势在于直观,表格的优势在于精确。有些图形下方放置表格(如Kaplan Meier生存曲线图形下用表格展示各时点的人数)两者互补,可更直观、精确地展示研究结果。


7.

讨  论:

关于统计图形,国内外学者均有总结相关的绘图原则[620],但仅针对简单的线图、点图等图形,涉及图种较少且绘制要求较为简略。绘制一张图,不仅是为了画图,而是引导读者更好地理解图形的内容。针对图形中的每个元素和细节,反复打磨,最大程度地达到一图胜千言的效果[21]。本文以医学统计图形的构成要素和设计要求为主题,整理了统计图形中的基本要素,总结了绘图需遵守的设计原则,最后从图形设计角度出发,提出图形变化、美化的常用方法以及复合统计图形的一般形式,为广大医学研究者提供了较实用的建议。


本研究结合统计学角度和图形美学角度,总结了图形的基本要素和一般性绘图原则,难以做到面面俱到。但本文提供的思路及设计要点,具有一定的科学性和通用性,所总结的绘图的经验原则值得医学研究者参考和应用。数据可视化手段已在当今时代大放异彩,如何以精准、简约、优美的统计图形去匹配丰富多样的科学研究结果,值得深入研究与思考。


参考文献

利益冲突  所有作者声明无利益冲突

作者贡献声明  略

微信制作  斗智

长按二维码订阅本刊

主管:中国科学技术协会

主办:中华医学会

编辑:中华流行病学杂志编辑委员会

地址:北京市昌平区昌百路155号传染病所

网址:http://chinaepi.icdc.cn

总编辑:李立明

编辑部主任:王岚

Chinese Journal of Epidemiology

中华流行病学杂志

ISSN 0254-6450

CN 11-2338/R

长按二维码关注我们

编辑部电话:010-58900730

中华流行病学微平台

长按二维码关注我们

  下载全文


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存