其他
“遇事不决,量子力学”?微软亚研院开源时空预测开源工具:FOST,应对各行业共性预测需求!
The following article is from 微软研究院AI头条 Author 微软亚洲研究院
关注公众号,发现CV技术之美
编者按:2020年新冠疫情肆虐全球,为了控制疫情蔓延,找到应对措施,美国疾病控制中心公布了大量疫情相关数据,向全世界顶级科研机构救助,希望科学家们可以利用技术能力,提供具有较高参考价值的预测数据,从而帮助制定有效的控制策略。微软亚洲研究院基于时空预测技术,训练了针对新冠疫情的预测模型,并于2020年下半年被美国疾控中心采纳使用。在过去的近一年中,该预测模型的表现整体优于全球其它四十几家科研机构提供的预测模型。日前,微软亚洲研究院基于此前的技术积累,正式推出了面向全行业的时空预测开源工具 FOST。
数据处理:数据降噪,提升数据质量 在 FOST 中,数据的收集由用户自主完成,这既保证了能够基于多样的场景数据训练出不同的业务场景模型,又保证了用户数据的隐私安全。之后,FOST 会针对存在噪音等问题的质量低下的数据进行清洗,提升数据质量,确保模型训练的准确度。 时序解码:轻量级时序神经网络 在时序预测上,微软亚洲研究院采用了轻量级深度时序神经网络。 深度时序神经网络主要用来捕捉实际业务场景中的复杂历史规律。以物流行业为例,可能数据显示某几个站点在夏季派件量比平时多,那么是否就可以推测出下个夏天派件量同样会上涨呢?实际的关联关系通常并不是这么简单就可以推断出来的。深度时序网络的作用就是找出其中的复杂关联和细节规律。 但深度时序神经网络往往面临训练速度慢,对于噪声敏感的问题。同时在数据量不充足的情况下,容易过拟合训练数据。因此,微软亚洲研究院在深度时序神经网络的基础上通过对时序数据降维,使结构轻量化,从而加速训练效率并稳定预测结果。 空间解码:图神经网络构建层次图 在空间层上,微软亚洲研究院采用了图神经网络,通过节点间的空间联系,来建模信号变化在空间上的相互影响和关联。例如在疫情数据预测中,一个地区的疫情结果会受到其他区域,尤其是相邻地区的影响,所以预测时也不能忽略空间上的关联。对此,微软亚洲研究院利用图神经网络,在预测疫情发展信息时,也将其他省市的信息参考进来,进一步提升预测的精度。引入图卷积网络后,无论是针对县区的细粒度预测,还是省市级别的粗粒度预测,结果的准确性都大大提升。
END
欢迎加入「计算机视觉」交流群👇备注:CV