查看原文
其他

ChatGPT在交通拥堵指数系统中的应用实践

庄立坚、郑又伦等 赛文交通网 2023-12-17


庄立坚、郑又伦、徐若辰、傅华斌 | 作者

安安 | 编辑

包图网 | 头图来源

引言:ChatGPT是OpenAI公司的旗舰产品,为大型自然语言处理模型的巅峰之作。自2015年发展至今,已经历了四次重大的迭代更新,直至目前的GPT-4版本。该模型基于Transformer神经网络架构,展现了卓越的语言理解与文本生成能力。
当下,众多行业和研究者的精力集中于构建大语言模型,诸如百度的文心一言、讯飞星火,以及基于开源的ChatGLM、小羊驼Vicuna等各类私域模型。但笔者认为可换个视角,尝试将已有大语言模型工具与大数据场景结合,聚焦用好大语言模型工具。
因此,本文以场景创新入手,尝试探索ChatGPT在交通拥堵指数系统中的应用价值。
01现状痛点
交通拥堵指数(以下简称“指数”)是对路网总体运行状况进行定量化评估的综合性指标,一般而言,指数越大表明一次出行相比顺畅状况多花费的时间越长。
以深圳为例,指数系统自2012年启动建设以来,在全市道路交通运行监测、分析与服务方面,为领导决策、行业管理、公众出行提供了科学数据依据,同时为交通规划、综合治理等业务提供了丰富的应用工具,发挥了大数据的决策支撑作用。
虽然指数系统在超过10年的迭代中,已经形成了完备的时空查询体系与海量的可视化工具,但依然存在一些痛点诉求:
其一,在系统中查询不同时空维度的交通拥堵指数时,需要用户输入特定的时间条件、空间维度和计算颗粒度,细分的可选查询组合超过1万种,虽然任何场景下的数据确实都能通过条件查询获得,但始终不够智能,略显繁琐。如果存在大量差异化的查询场景,显然会有很多重复性的操作,耗费不少时间。
下图为指数系统中典型的多条件数据查询与出图界面。
其二,从系统查询得到的数据是较为零散的,无法作为结论直接呈送,还需要结合交通专业知识,考虑因果逻辑与数据前后对比,对数据进行语义表达的重组,形成一段文字或者一篇系统性的报告,方能应用到实际的工作中。
这个过程,基本还是依赖于人的脑力劳动,甚至受制于“人”本身。下图为一份典型的交通运行简报案例。

今年年初ChatGPT如燎原之火一般燃烧,掀起了国内大模型与各行业结合发展的一次高潮。那在交通领域,ChatGPT与指数系统能碰撞出什么火花呢?结合上述提及的痛点,我们认为可以结合ChatGPT打造指数机器人,探索以下应用场景:

  • 多种时空查询条件的准确理解:支持对不同时间、空间和计算颗粒度的交叉组合查询条件快速文字理解,准确输出查询结果,同时可通过语音方式输入。

  • 智能生成可视化图形:基于用户的数据需求和应用场景,自动生成可视化图形、图表,形象表达指标变化规律。

  • 快速生成简易的报告:根据用户的个性化需求,自动生成交通运行分析简报,节省报告编制的人力投入。
02整体架构
如下图所示,简单描述一下指数机器人的技术实现路径。
1、知识向量化:想象我们拥有一大堆文档和知识片段,这些就像一堆散落的拼图。要做的第一步,就是把这些拼图按照类别排好序,然后给每一片拼图贴上一张标签,这个过程就好比是我们的embedding向量化技术。
2、数据库构建:我们把这些带标签的拼图放入自己的"拼图数据库"。每当你有一个问题,我们就把你的问题视为一片新的拼图,也给它贴上一个标签。
3、相似度匹配:我们在"拼图数据库"里,通过比较标签的相似度,找到最匹配你的问题(新拼图)的那几片拼图,这就像是用余弦相似度算法来找到最相关的知识片段。
4、场景化重组:我们把这些与你的问题最匹配的拼图,连同你的问题,一起交给我们的"超级拼图高手",也就是大型语言模型(LLM)。模型会根据这些信息,为你找到最完美的答案并进行表达重组。无论你需要的是一段代码,还是一个专业的回答,这个"超级拼图高手"都能完成。
03应用情况
1、更便捷:多种时空查询条件的准确理解
对于不同时间范围和空间维度的指标查询需求,通过聊天窗口进行输入,指数机器人识别后会对后台数据快速检索,即可在秒级范围内输出查询结果。相较以往交通拥堵指数查询的方式,指数机器人通过模糊对话的方式即可快捷获得查询结果,尤其对领导层级的用户相对友好,增加了可触达性。
示例:请查询2022年深圳市最拥堵和最畅通的分别是哪一天,交通指数和平均速度为多少?
示例:请查询2023年劳动节前一天全市晚高峰最拥堵的三个行政区,他们的交通指数和平均速度分别是多少?
2、更形象:智能生成可视化图形
除了数据查询本身,指数系统也能形成大量的可视化图表,我们也在思考:这些成果是否也可以基于ChatGPT做快捷输出?答案是确定的。我们将查询出来的数据,根据用户的个性化需求,利用ChatGPT自动生成可视化图表的代码,并在前端对话框进行呈现,让数据表达更加形象。
示例:请生成一张深圳市福田区2019年至2022年早、晚高峰交通指数的条形图。
示例:请用表格给出深圳市2023年端午节3天假期各行政区的平均交通指数和运行速度,并计算对比2022年的变化幅度。
3、更智能:快速生成简易的报告
除了数据和图表本身,在节假日、春秋开学季、大型活动等特殊场景下,我们往往需要编制专题分析报告。通常,一份报告的编写需要技术人员进行数据查询、数据提炼、文字编写、排版优化等几个步骤后才能将定稿,耗时较长,同时技术人员耐心、细心的校对才能确保数据准确、表达无误。
基于ChatGPT的指数机器人可以有效避免因人为原因导致数据缺失、表达不通顺等低级纰漏的发生,同时也可以根据用户的需求与偏好,快速生成“千人千面”的交通运行分析简报,降低门槛,提高效率。
示例:请生成一份2023年端午节期间深圳市交通运行分析简报,报告以全市、行政区和街道维度进行分析,给出最拥堵时段,以及上述三个空间维度下的交通运行指数和平均速度,环比去年的变化情况。
04总结展望
以上所述只是指数机器人的冰山一角,但已经充分证明了ChatGPT与交通拥堵指数系统相结合的潜力。这样的结合不仅可以作为我们日常工作的有效辅助工具,帮助我们简化复杂任务,还在很大程度上提升了我们的工作效率。
放眼全球,作为人工智能领域的佼佼者,ChatGPT无疑是一道智能之泉,悄然而细致地滋养着我们的工作与生活。它和其它工具的结合被应用在图文生成、数据统计分析等多个相关领域,实现了技术的飞跃,广泛地影响着社会生活的各个方面。
然而,对于更精细化的工作,人工智能仍然存在技术瓶颈,难以全面取代人类的角色,只能作为一种工具辅助人类完成各种任务,提高工作效率。特别在交通领域,虽然人工智能的应用越来越广泛,但它仍然无法完全替代交通工程师的工作。
执行过程中,数据质量的不稳定性、算法准确性的需求等问题依然会暴露出来,这就要求我们的交通工程师依据自身专业知识与工作经验,将其转化为推动创新和场景应用的强大动力,共同推动智能交通事业的发展。

点击下方【小程序】报参加交通运输“数据大脑”技术研讨会
点击下方【小程序】报名参加智能交通企业海外业务拓展与合作交流会

RECOMMEND
推荐阅读
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存