飞桨时序模型库PaddleTS具备统一的时序数据结构、全面的基础模型功能、丰富的数据处理和分析算子以及领先的深度时序算法,可以帮助开发者实现时序数据处理、分析、建模、预测全流程,在预测性维护、能耗分析、价格销量预估等场景中有重要应用价值。
近期,PaddleTSv1.1版本重磅发布,带来了在模型推理、模型可解释性、新增模型算法等多方面的重要升级:
- 更高效的推理部署:基于Paddle Inference实现高吞吐、低时延的推理部署,MLP模型推理耗时降低98%!
- 新增时序分类模块:覆盖更多应用场景需求,让开发者一站式解决时序分类问题!
- 提升模型解释能力:两种技术实现模型解释性,帮助开发者更好理解模型结果!
- 表征学习支持分类与聚类:针对先进的表征学习,提供即开即用的表征分类与聚类模型,提高开发效率!
- 扩充深度学习模型:增加更多时序预测与异常检测模型,帮助开发者探索更多的领先模型!
https://github.com/PaddlePaddle/PaddleTS
核心升级点解读
可利用Paddle Inference进行推理部署Paddle Inference是飞桨的原生推理库,作用于服务器和云端,提供高性能的推理能力。其针对不同平台不同的应用场景进行了深度的适配优化,提供了C、C++、Python、Golang四种API,实现做到高吞吐、低时延的推理部署。同时,通过对计算图的分析,完成对计算图的一系列的优化,如OP的融合、内存/显存的优化、MKLDNN、TensorRT等底层加速库的支持等。
PaddleTSv1.1支持了原生飞桨Paddle Network模型的导出以及前序数据自动构建功能,实现PaddleTS模型在多系统、多语言、多平台的适配。开发者利用Paddle Inference即可完成推理部署,加速PaddleTS模型应用的最后一公里,保证了PaddleTS模型在服务器端即训即用,快速部署。
以MLP和Informer为例,使用Paddle Inference推理后,MLP模型推理耗时降低约98%,Informer模型推理耗时降低约50%。
https://paddlets.readthedocs.io/zh_CN/stable/source/modules/models/paddle_inference.html
时间序列分类是时序预测任务中的一种,其目的是利用标记好的训练数据(每个时间序列所属类别),预测未来时间序列的分类,从而指导决策。时间序列分类在一些时间敏感的应用领域至关重要,例如健康信息学、异常检测、设备状态识别等。
PaddleTSv1.1的时序分类模块,新增两个时序分类深度模型——经典的CNN以及领先的InceptionTime,同时提供ClassifyBaseModel基类,开发者可利用其构建时序分类模型。
同时,PaddleTSv1.1支持两种分类结果评估方式,既可直接使用PaddleTS中预置的accuracy_score函数,也可调用sklearn.metrics相关评估算子,实现模型分类效果的评估。
开发者可以使用PaddleTS构建时序分类模型,得到未来时间序列的分类结果及每个分类的概率,如设备故障类型、患病类型等。也可用来辅助用于时序数据的预处理,如检测数据周期性并剔除,从而进行正常历史数据的学习或异常检测,实现预测或检测准确率的提升。
https://paddlets.readthedocs.io/zh_CN/latest/source/modules/models/classify.html
近年来随着深度学习的发展,深度时序模型逐步超越了浅层模型取得了更好的效果。但深度模型由于其复杂的网络结构,往往难以解释预测结果是如何产生的,给使用者带来困扰,由此,模型解释性技术应运而生。PaddleTSv1.1提供ante-hoc(模型相关)和post-hoc(模型无关)两种方式提升模型可解释性。
ante-hoc是一种模型相关的方法,即开发者在模型设计阶段就考虑了模型可解释性的问题,因此往往会设计特殊的模型结构或损失函数,便于对已训练好的模型进行评估。PaddleTSv1.1的ante-hoc模块引入了TFT模型,分别从特征权重、注意力评分角度对模型结果进行解释。
特征权重在掌握模型的关键特征方面具有重要作用,特征权重越高,代表特征对预测结果的影响越大。TFT模型将时序特征可以分为静态特征、历史特征、未来特征三类,用户可以分析不同类别下的特征权重。
在进行时间序列建模时,不同时刻点之间存在着一定的相互依赖关系,自注意力机制可以最大程度上挖掘任意两个点之间的关系,从而在进行时序预测时抽取强相关特征点的关键信息,使得预测更加准确。自注意力评分可以帮助用户判断对于预测结果影响更大的时间序列节点。以TFT模型为例,注意力评分支持从“单步多分位数预测”与“多步单分位数预测”两个角度给出注意力机制的分数权重的可视化展示,帮助开发者更好地分析时间序列的周期模式。
post-hoc是一种模型无关的方法,把模型视为一个黑盒,通过外部添加扰动或建立一个代理模型等方法,对已训练好的模型进行评估和解释。PaddleTSv1.1的post-hoc模块,基于SHAP方法实现了模型的特征归因,开发者仅需将模型和训练数据作为输入,即可得到不同时间、协变量对输出结果的贡献,帮助决策者理解模型结果、指导业务优化。
https://paddlets.readthedocs.io/zh_CN/latest/source/modules/xai/overview.html
在历史版本中,PaddleTS提供了表征预测模型ReprForecaster,实现了表征学习和下游预测任务相结合的全流程封装,避免用户处理表征与下游任务结合的复杂处理流程,在解决表征预测问题的同时降低开发者使用门槛,真正实现了模型的即开即用。
PaddleTSv1.1增加了表征分类模型ReprClassifier和表征聚类模型ReprCluster,针对时序分类和时序聚类问题也可以实现表征学习的快速应用。
https://paddlets.readthedocs.io/zh_CN/latest/source/modules/models/representation.html❤️以上就是本次PaddleTSv1.1升级的核心功能解读,更多新功能可点击下方链接查看,欢迎大家积极试用。
https://github.com/PaddlePaddle/PaddleTS/wiki/PaddleTS-1.1.0-Release-Note-CN
https://github.com/PaddlePaddle/PaddleTS/https://paddlets.readthedocs.io/https://github.com/PaddlePaddle/PaddleTS/issues加入PaddleTS官方技术交流群,更多福利等你来拿~
福利一:获取 PaddleTS 历史课程链接;
福利二:获取 PaddleTS 团队整理的重磅学习礼包;
扫描下方二维码,关注公众号,填写问卷入群领取福利!
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~