【专稿】让海运不再航无定时,ETA预测AI算法新突破——上海国际航运研究中心 徐凯 郑达辉
点击关注航运评论,置顶公众号
知晓最新 最权威的航运评论
提供最前沿的市场报告
━━━━━━
在集装箱班轮运输业务中,船期表作为船舶航行靠泊的时间表,是货主们订舱和制订物流计划的重要依据。在船期表中最为重要的要素就是班轮的挂港次序,以及在各港口的预计到港时间(ETA)和预计开航时间(ETD)。
亿海蓝准点率产品显示的船舶航行准班率
然而由于各种因素的限制,船公司提供的船期表平均误差高达30-40小时(远洋+近洋平均值)。影响船舶到港时间的原因非常复杂,天气、塞港、季节以及船公司的指令等都可能成为重要因素。
经过长时间的研究,港航大数据实验室终于成功地建立了精准预测的模型,将到港时间预测误差分别大幅降低到6-8小时(距离目的港2周)和2-4小时(距离目的港1周)。
一、准确的ETA到底有何意义?
集装箱班轮“航无定时”积弊已久。类似于集装箱班轮,其它固定班次的运输方式也有自己的“船期表”,飞机航班有时刻表,火车班次同样有列车时刻表。但由于运输方式的不同特点,飞机和火车的ETA时间都是精确到分钟的,集装箱班轮却只能精确到天,并且准班率远低于另外两种运输方式。此外,火车通常不会取消班次,或是减少挂靠站点,飞机和班轮则既有可能取消航次,又有可能临时修改挂靠港或是跳港。因此,集装箱班轮船期成为设计国际物流解决方案中最不可控的因素,也是多式联运货主最难把控的运输风险点。
国际物流货主的需求可以概括为运费、时效、透明三个方面。运费方面,货主当然希望在同等服务下运费尽量低廉,但有时运费稳定对于有效控制成本风险更重要;时效方面,货主当然希望运输更快捷,但通常守时稳定地送达对于协调多式联运风险更为重要;透明方面,当运价波动和时效稳定都不可控时,有效的感知变化、预知风险,增强运输市场和运输过程的透明化程度就非常重要了。
准确的ETA预测具有重要的现实意义。过去,一家公司通过海运运输货物时:若想知道船舶预计抵港时间,直接看船期表往往是不准确的,因为很多航线上船期耽误2-3天是常有的事;若想了解船期变化后的更准确抵港预测时间,只能通过代理询问船公司,这样低效的沟通也只能知道一个大概,对于韩进破产这样的重大异常几乎没有有效的解决方案;若想提前知道因为班轮跳港而导致甩箱的风险,就更没有头绪和渠道,对于下一个班次何时能够补载货物也缺乏有效参考信息。现在,虽然有了卫星AIS技术可以追踪船舶航行轨迹和实时动态,但由于AIS报文中显示的ETA时间是由船员填写且管理不够规范,准确性问题严重往往不可用,而当前船舶位置的显示对于只想了解未来准确ETA的货主而言帮助不大。
二、运用人工智能方法
提供有效的ETA预测
用人工智能(AI)来助力集装箱班轮ETA预测。为了解决当前班轮船期和ETA信息的不及时、不精确、不准确的问题,上海国际航运研究中心港航大数据实验室采用人工智能算法和大数据分析平台来研发ETA预测算法,彻底摈弃了过去围绕着“航行距离除以航速”来求解ETA的传统思维。
图1 港航大数据实验室ETA预测模型基本思路
如图1所示,是港航大数据实验室ETA预测模型的基本思路。首先,利用港航大数据实验室领先的轨迹数据分布式存取平台,抽取特定船型、航线上的船舶历史航行轨迹作为智能算法的训练样本;其次,通过人工智能算法在排除每条轨迹的个体差异特征的前提下,拟合出航行轨迹预测模型;最后,根据当前船舶航行位置、航速、船舶类型等信息作为输入量,代入预测模型进行ETA计算。
以中国上海港至墨西哥曼萨尼约港为例,两港之间的总航程约为6897.6海里,通过对12条班轮的历史航行情况进行统计(参考图2),航行天数平均为16.4天,最大差值为4.5天,标准差为1.35天(即实际航行天数与均值之间的误差约有32%的概率大于1.35天)。对于一条航行于太平洋上的班轮,在不考虑多港挂靠的情况下,这样的时效稳定性显然会对货主造成困扰。
图2 中国上海港至墨西哥曼萨尼约港历史航行天数统计
在上述航线检测本模型预测ETA结果的准确率,可以发现:在距离曼萨尼约港2600海里时(大约还需航行7天)误差大于一天的概率仅为2%,误差均值为0.25天(参考图3);在距离5200海里时(大约还需航行14天)误差大于一天的概率为12%,误差均值为0.36天(参考图4)。
图3 中国上海港至墨西哥曼萨尼约港提前2600海里的ETA预测误差值
图4 中国上海港至墨西哥曼萨尼约港提前5200海里的ETA预测误差值
图5 柴湾->宁波->上海->曼萨尼约->布韦那文图拉->卡亚俄的预测模型示意图
利用港航大数据实验室提出的ETA预测算法,也可以拓展至为多港挂靠情况进行ETA预测。图5所示的就是从“柴湾->宁波->上海->曼萨尼约->布韦那文图拉->卡亚俄”的一条班轮航线预测模型。我们以新香港号集装箱船(MMSI为477593600)的2017年的某1个航次和COSCO ADEN(MMSI为477765900)的1个航次为例,来进行实验。根据模型的预测航行时间加上途径港口的停泊时间预测,分别对两条船舶位于不同出发港时距离最终目的港的ETA时间进行了预测,结果如图6所示。
图6 船舶位于不同出发港时距离最终目的港的ETA时间预测结果与实际值比较
图7 船舶位于不同出发港时距离最终目的港的ETA时间预测误差
从图7中所示的误差值来看,从宁波港开始,到最终目的港卡亚俄港的ETA预测值就已经快速收缩到2天以内了。并且这种预测算法可以随着船舶的航行不断修正预测值,并对突发状况具有较好的自适应性。
三、精确ETA预测算法
的优势和应用前景
港航大数据实验室已经在十余条航线上验证了该算法的有效性。从算法原理的角度来看,该算法具有以下明显优于传统方法的优势。
(1)采用大数据技术提升海量数据的模型训练能力
过去AIS数据的应用往往不需要大数据技术,因为用户只需要查询船舶的当前位置和一段时间内的历史轨迹,搜索条件仅限于时间段、区域坐标、船舶名称(或ID)。本算法对按照航线和船舶类型检索海量船舶历史轨迹的能力提出了极高的要求,港航大数据实验室自主研发的云计算PaaS平台,采用了Kubernets+Docker+Spark的领先架构,使得这种轨迹提取变得轻而易举。为港航企业涉足大数据领域提供了一套行之有效的技术解决方案。
(2)加入时间特征的模型使得多因素预测更为准确
预测模型中加入了时间特征,虽然会增加算法设计的复杂度,但是考虑到船舶或是其它运载工具的行驶都不是绝对匀速的,所以这个特征的加入意义非凡。因为模型中会对航行中哪里会加速、哪里会减速,不同的船航行时具有什么个性化的速度特征等进行保留,不仅让ETA预测更为精准,还可以明确的判断船舶未来遭遇台风等恶劣天气的可能性。
(3)个性化预测模型使得预测更为灵活
由于建模时提取了不同细分类型的船舶的一些特征,在进行预测时就可以根据每条船的特点进行个性化的预测,这使得预测模型的灵活性和适应性大大加强。
以该算法的研究为基础,未来可以拓展的应用方向还包括:
(1)提升港口的经营调度能力
若码头每日的抵港船舶预抵港时间可以准确得知,就可以据此来优化码头的装卸作业计划,同时对于堆存资源、锚地资源、泊位资源遭遇瓶颈的码头,全局范围内的船舶ETA预测,可以使得人们有可能提前干预行驶中的船舶,避免在港口等待或拥堵。
(2)提升多式联运方案执行风险控制
在国际多式联运信息化解决方案中,提前多天预警可能的晚班情况,可以帮助货主紧急采取调整措施或备用方案,对于遭遇甩箱或是压港的货主,也可以对未来一段时间的补载时间做出推测,或是对压港持续时间做出预判。
(3)提升大宗商品海运贸易分析精准性
ETA预测算法对于散货船舶同样有效,因此通过分析未来大宗商品海上贸易船舶的ETA,可以有效的预估半个月或者更长时间某个地区的大宗商品现货补充量,这可以有效的提升对大宗商品贸易、现货、期货市场的预测准确性。
港航大数据实验室正在致力于更深入的挖掘航运业的数据分析需求和应用场景,帮助拥有数据的企业兑现更多数据价值,帮助需要数据的企业得到可靠的、易用的数据。本文所介绍的工作只是港航大数据实验室众多研究成果中的一项,期待未来与业界同仁们共同开展更多的研究合作。
作者 徐凯 郑达辉
联系电话 021-65853850-8006/8008
(点击图片了解更多)
【专稿】传统业务面临挑战,航交所转型势在必行——上海国际航运研究中心 徐凯
【专稿】如何翱翔在航运创新的风口上?——上海国际航运研究中心 徐凯
【专稿】阿里的“物贸一体化”谋略——上海国际航运研究中心 徐凯
【专稿】船舶服务类电商平台获得招商创投资本青睐——上海国际航运研究中心 彭宜蔷 张敏
随时随地看新闻 搜资讯 查数据
了解最新 最权威的
航运评论
手机扫一扫,关注“航运评论”微信号