数据可视化:浅谈热力图如何在前端实现
作者:个推开发工程师甄鑫
当我们需要用更加直观有效的形式来展现各类大数据信息时,热力图无疑是一种很好的方式。作为一种密度图,热力图一般使用不同颜色的区块叠加在地图上,实时描述人群分布、密度和变化趋势,颜色越深,代表该区域人群聚集度越高;反之,颜色越浅,则代表区域人群聚集度越低。
热力图的最终效果常常优于离散点的直接显示。依托多年推送服务的积累和海量数据资源的优势,个推热力图能够直观地展现各区域的人群分布和密集情况,为相关的应用提供可视化的数据支持。
那么制作一张完整的热力图,需要前端人员进行哪些工作呢?本文基于个推开发工程师甄鑫在工作过程中的实践,为开发者们详细解析热力图在前端的实现过程。
首先,我们可以先观察一张完整的热力图实现效果图:
关于热力图的实现原理
热力图的实现原理一般可大致归纳为以下几个步骤:
1.为每个数据点设置一个从中心向外,灰度渐变的圆;
2.利用灰度可以叠加的原理,计算每个像素点数据交叉叠加得到的灰度值;
3.根据每个像素计算得到的灰度值,在一条彩色色带中进行颜色映射,最后对图像进行着色,得到热力图。
当热力图基于前端技术被具体实现时,又可分为以下四个步骤:
1
准备热力图数据格式
由于热力图使用场景一般为地图,所以,数据源需要提供经纬度作为位置信息,以及count作为数据点的权重值。具体数据格式示例如下:
2
在地图上填充数据
基于Canvas绘制热力图时,热力图中每个数据点的半径大小会直接影响到热力图的展现效果,所以一般要结合使用地图的缩放级别以及数据精度来进行设置,本文示例默认设为15px.
通过上述步骤画出的点的样式如下图所示,是一个由内向外放射渐变的灰色圆:
所有点叠加在地图上的效果如下图所示:
3
叠加显示,权重(密度)算法
在上面的绘制结果中,因为没有使用到权重值,所以每个数据点圆的中心点灰度值都是1,不能直接用于颜色映射,需要根据离散点缓冲区的叠加来确定热力分布密度。每一个热点都有一个位置和权重,权重越大,则该点越显著,也就代表其渐变的一个衰变因素,此时,我们需要根据不同的count设置出不同的alpha值。本文主要根据count最小值对应alpha0,最大值对应1的映射计算方式,求得每个数据点,从而绘制出alpha:
结合上一步骤,在Canvas中完整的绘制方法如下:
具体绘制出的效果如下图所示,从实例图的对比中可以看出,一个好的权重映射方法对热力图的显示效果起到非常重要的作用。
4
颜色映射
根据画布上每个像素点累计得到的灰度值,可以从彩色映射色带中得到对应位置的颜色。
那么如何得到画布上每个像素点的信息呢?可以使用Canvas提供的getImageData()方法,返回 ImageData 对象,该对象拷贝了画布指定矩形的像素数据。需要注意的是,ImageData对象中的每个像素,都包含RGBA四项信息:
根据Canvas提供的putImageData()方法,可以将像素级的数据放回到画布中。
在热力图绘制过程中,利用这两个方法,可以从上一步骤绘制得到的热力图中获得每个像素点叠加得到的alpha通道的灰度值(0~255),再建立一条长度为256px的彩色色带,从中映射得到该像素点对应的颜色RGB值。
建立一条长度为256px彩虹条的过程如下图所示:
自定义颜色得到的彩色条示例:
从彩虹条中映射颜色的过程如下所示:
经过以上步骤,我们可以得到的热力图效果如下:
最后,为大家提供一个热力图的性能优化方法,由于热力图一次性加载的点过多,所以容易出现卡顿问题,而前端在渲染热力图时,可以进行热力图的点聚合优化。关于点聚合优化的实施方法:将视窗划分成为网格进行操作,由此判断热力图数据点在网格中所处的位置,如果同时几个点处于一个网格,则合并这几个点,以此降低渲染成本。
前端人员可以利用下列代码判断每个点在网格中的分布位置:
网格划分以及点聚合方法如下:
以上就是热力图的前端实践过程。热力图可以被应用于多种业务当中,让大数据得到更为直观的展现。
关于热力图的应用
一个完整的热力图可以被应用于多项业务当中。个推热力图便能够展现景区的人流分布状况,通过不同颜色区块的叠加,展示景区不同区域的人口密度,协助景区做好智能管理。此外,个推热力图还能为灾害救援提供支持,有效指导人群疏散,为政府部门的灾后救援工作提供重大帮助。