数字中国创新大赛-算法赛道冠军技术方案曝光!
2020数字中国创新大赛(Digital China Innovation Contest, DCIC 2020),由“数字中国建设峰会组委会”主办,以“培育数字经济新动能,助推数字中国新发展”为主题。数字政府赛道作为数字中国创新大赛的主要赛道之一,本次赛事以推动福建省政务数字化升级为契机,围绕政务大数据展开,聚焦智慧海洋、政务服务、智慧社区、城市管理四大领域,以应用为导向,聚集全球顶级技术创新人才,发掘先进的人工智能与政务融合的创新应用成果。利用大数据提升政府治理能力和水平,加速福州乃至福建全省数字经济新业态的形成,持续诠释“数字中国”国家战略。
赛题背景
数据示例
渔船ID:渔船的唯一识别,结果文件以此ID为标示
x:渔船在平面坐标系的x轴坐标
y:渔船在平面坐标系的y轴坐标
速度:渔船当前时刻航速,单位节
方向:渔船当前时刻航首向,单位度
time:数据上报时刻,单位月日 时:分
type:渔船label,作业类型
原始数据经过脱敏处理,渔船信息被隐去,坐标等信息精度和位置被转换偏移。
选手可通过学习围网、刺网、拖网等专业知识辅助大赛数据处理。
AIS数据
ais_id:AIS设备的唯一识别ID
评估指标
其中P为某类别的准确率,R为某类别的召回率,评测程序f1函数为sklearn.metrics.f1_score,average='macro&apos。
数据探索&信息挖掘
▶▷ 围网变化情况
围网很多都有明显的画圆或者半圆的痕迹;
有些围网看上去像是快速转圈的情况;
▶▷ 刺网变化情况
刺网的线段看上去很多较为规范,很多看上去像是在很多地方放了很多网,然后船去收网的样子。
特征工程框架
单属性特征,从速度、方向、经纬度等方面,由全局和局部两个方向,从分位数特征、分桶统计特征刻画渔船的基本画像。
多属性特征,采用速度相关的交叉特征为主。
算法框架
很多样本经纬度几乎不变,速度方向信息受波浪影响波动,可能是停泊等原因,分开建模。
设备匹配算法
▶▷ TWS和SWS
(1)当两个轨迹在长时间和长距离内相似,那么它们就应该是相似的,则称其为同源轨迹。
(2)这里通过时间加权相似(TWS)和空间加权相似度(SWS)两种路径匹配算法来匹配北斗数据和AIS数据,同时帮助挖掘AIS数据的价值。
▶▷ 基于对抗验证的匹配算法(杰少尘沙)
本赛题杰少提出了 基于对抗验证的匹配算法,将无监督问题转为有监督问题,同时易于加入多种不同的信息,将多种不同的因素信息一起进行考虑。
我们根据两种设备轨迹匹配出相似度得分,反向丰富渔船的画像部分。丰富的渔船图谱构建完成后,结合对渔船作业类型的挖掘,可以很好的识别违规捕捞等行为,同时在安全角度,对作业类型的准确识别可以采取正确的避让措施,避免事故的发生。结合AIS和北斗数据在对轨迹进行深度挖掘时我们发现,不同作业的渔船,其行驶轨迹、速度、经纬度变化等都存在一定的差异。
系统架构
可视化方案部分,由首席全栈搬砖师 林有夕 实现了系统的搭建。主要包含:
(1)Angular.js前端框架 + echarts可视化,完成前后端分离设计,保证代码和数据安全;
(2)Nginx + Flask 实现web接口 ,灵活部署。利用数据预计算+缓存+索引优化技术,提高效率。
应用架构
▶▷ 海洋画像与知识图谱
渔船作业种类繁多,分布差异巨大,对渔船进行大数据画像,描绘知识图谱,以便于政府部门掌握渔船的 基本信息、状态监控和行为特点等。
比如,我们在渔船画像部分,可以直接根据渔船ID,查看不同时间段内查看渔船的速度、航行稳定性、掉线情况、常驻港口等,并根据当前数据给出渔船和渔船所处海域的安全等级。同时由历史数据构成的渔船动态画像,可以清晰的了解船只的作业习惯、设备稳定性等。
渔船知识图谱作为渔船画像的基础建设,帮助掌握了渔船基本情况,当进行了多源轨迹匹配后,我们对船只的了解将由点到面的扩展开来。
▶▷ 多源时空轨迹数据匹配
船舶避碰终端(AIS)、北斗定位终端等通信导航设备的应用,给海上交通和作业带来了极大便利,但也产生了新的问题,即设备信息不规范导致目标信息失真,进而使得商船误入养殖区、渔船碰撞商船等事故时有发生,每年都会巨大的人身和财产损失,给海上安全治理带来了极大挑战。通过分析AIS设备位置数据,得出是哪一类目标在使用该设备;同时能够通过分析渔船北斗设备位置数据(船号清楚)和AIS设备位置数据(船号不清),得出是哪一艘船在使用该AIS设备,成为更好的使用北斗数据和AIS数据的关键。
▶▷ 流量监控与预测
使用时序模型预测渔船未来30分钟所在的位置,并结合风控画像计算碰撞指数。综合考量船速、渔船密度、设备掉线时常、定位漂移率等指标。
流量预测方面,结合船只运行轨迹以及历史行为对未来24小时区域进行流量预测。
团队介绍
关注技术说,我们只凭技术说话!
点在看会少个bug哦👇