注:文章末尾有何珊演讲视频和PPT
Kepler.gl is a powerful open source geospatial analysis tool for large-scale data sets
无论是使用框架还是工具,创建交互式可视化都遵循一个类似的过程:数据收集、数据处理、通过基于 web 的工具如 QGIS、Carto 和 Mapbox Studio 进行可视化探索,然后利用 React、D3.js 和 Three.js 将可视化转换为 Javascript,以构建原型。这个过程不仅冗长乏味,也无法保证一定就能获得有用的可视化。在许多情况下,大家都只是有可视化的想法,但并没有时间和人力来实现可视化。
为了让拥有丰富经验和较高技能水平的用户更容易创建有用的数据可视化,Uber宣布启用开源地理分析工具 kepler.gl。建立在 deck.gl WebGL 数据可视化框架之上的 kepler.gl,通过快速实现地理空间数据的可视化想法,来扩展地图的创建过程。
而这个与众不同的产品背后就有一位与众不同的作者-何珊。
一、何珊是谁?
- 何珊,麻省理工学院硕士,Uber数据可视化团队创始人,行业内数据可视化专家,kepler.gl作者;
- 本科时在清华大学学习建筑,积累了图形、平面等设计的经验和技能;
- 毕业后加入设计公司Blu Homes时,接触了三维空间可视化网页,开始学习网站设计;
- 工作中从事交互设计方面的工作,但感觉开发人员太不给力了,经常无法实现她的设计,所有她觉得有必要进一步学习开发,于是进入了MIT学习program design communication,毕业后作为一名研究员加入了MIT Senseable City Lab,开始接手一系列数据可视化项目;
- 加入Uber,正式开始了她的数据可视化职业生涯,当时的整个团队只有她一个人;
- 4月份离开Uber,成为了初创公司Unfolded的联合创始人,致力于下一代空间分析平台的开发;
什么是数据可视化?简而言之,数据可视化就是研究如何将数据转换成人眼能够看得懂的图像;1、从数据中能够找寻规律,这种数据的规律通过可视化手段表现出来之后会变得更加的直观;
2、让数据变得更容易理解,数据是很枯燥的,但是图像和图像是符合人类的认知习惯的,所以接受起来更加的容易;
3、让数据成为一个可以交互体验的媒介,从单调的数据呈现到数据探索,规律发现;
4、能通过数据来说一个故事,通过数据可视化的手段可以让你的故事讲的更生动;
5、通过数据的分析进而得到一个可行性的方案,这也就是我们通常说的辅助决策;
通过上面这些目的的分析,你会发现如果要做好可视化就需要具备设计、统计、编码以及讲故事这四项能力,而这四项能力是密不可分的;通常的可视化的过程不是一蹴而就的,是一个不断重复的过程:草图、平面样本、原型和产品,而这个过程是一个很漫长和很痛苦的过程;Uber拼车部门有一个数据可视化的需求,而这个可视化的目的就是为了验证一个假想:“拼车时车流量会变小,道路的通勤效率会更高”;其实这个思路比较清晰,就是对比一下分别搭车的车流量场景和拼车场景下的车流量场景,看一下车流量是否有明显的降低;第一步就是就是拼车数据的收集和分别搭车行程的模拟;第二步骤就是挑选合适的数据表现方法,为此尝试了不同的方法:1、动态路径过程展示,但是不够明显;2、尝试了散点图,同样不够明显;再三尝试后,最后选择使用颜色来表示路径的车流量,对比效果比较直观;2、基于上面的一次可视化的经历,作者觉得为她此探索出了一套有效的数据可视化方法:数据上传、数据处理、图像编码、生成可视化,而这个方法经验可以影响到更多的人,为此就希望将这个过程沉淀下来,做成一个大规模地理理定位数据集的可视化探索的工具包。3、作者希望形成一种类似于Photoshop的使用体验:1)数据可以简单的拖拽式的上传;2)将数据按照不同的类型分成不同的图层;3)针对每个图层可以使用侧方的面板进行样式调整;在数据可视化方面“统计分析+艺术+开发技术”的结合通常都可以创造出不一样的东西,比如现在的何珊以及Vue的创始人尤雨溪都是先有设计的基础,然后结合前端开发技术做出来的产品和框架都很有特色;如果你是微电子方向同时对测量理论又有一定的研究,那很容易就会在定位导航领域碰撞出一些不一样的火花;顺着这个问题再多说一句,我后台经常会收到有些考研的咨询,最多的问题就是:我是XX专业的,我跨专业去考GIS会不会被歧视?上面何珊这个案例就是最好的说明,不仅不会有影响而且会很加分,GIS本身就是一个多学科融合的专业,GIS作为一种基础能力,他真正的价值是需要到行业应用场景中去沉淀,而这种融合就需要多元化的吸收,往往把GIS用的最好的都不是GISer,这个问题不仅在GIS方面是这样,我相信其他专业也是一样的。就像很多计算机出身的开发人员,出于Job Security的考虑以及最近类似电子商务平台的盛行,每天就琢磨着研究海量并发,AI算法之类的通用场景,大部分都是假想的场景,空中楼阁,但是对于眼前的海量空间数据的加载优化却毫无兴趣,认为这个特殊的东西不具备通用性,而一般的GISer又缺乏系统的计算机系统理论训练所以在这类的优化上又显得束手无策。高效的研究和学习不应该只是把自己限定在某个岗位上,更多的是应该要结合场景和行业上,而且更容易创造出与众不同。关注公众号“GIS小丸子”,回复“数据可视化”,获取何珊完整版本演讲PPT “kepler.gl在海量地理定位数据可视化的应用!”最后附上何珊分享的现场视频(拍摄角度刁钻,最好配合着PPT观看):