基于SuperMap iDesktopX的交互式AI模型训练与推理
什么是AI模型训练?
在人工智能中,面对大量的用户输入数据或素材,如何在杂乱无章的内容中,准确、容易地识别并输出我们期待输出的图像或语音?算法就显得尤为重要。算法,就是我们所说的模型。算法的内容,除了核心识别引擎,也包括各种配置参数,例如图像分类的形状、颜色、质地等,语音识别的比特率、采样率、音色、音调、音频等。成熟的识别引擎,核心内容一般不会变化,为实现“识别成功”这一目标,就需要对配置参数做调整。不同的输入配置不同的参数值,最后在统计结果中取一组各方比较均衡、识别率较高的参数值。这个过程,就是“训练(Training)”,这组参数值,就是训练得到的结果。简言之,模型训练是为达成高识别率的目标,使用大数据,找出最优配置参数的过程。
什么是AI模型推理?
经过训练的模型可以将其所学到的知识应用在数字世界的任务,例如识别图像中的树、道路、猫狗等,识别语音中的“嗯”、“啊”、“这个”、“那个”等口头语,或者在浏览了一款鞋子之后推荐你可能购买的鞋子等各种各样的应用。基于训练的内容对其所获得的新数据进行“推导”,用人工智能领域的术语来说就是“推理(inference)”。推理,就是深度学习把从训练中学习到的能力应用到工作中去。
深度学习中的训练与推理过程示意(图片来源网络,侵删)
我们以实际的“南非电表类型识别与数据读取项目”为例,为您讲解基于iDesktopX的图像分类模型训练与推理的步骤。南非当地供电局需要收集住户电表读数,对住户用电情况进行管理。因为使用的是非智能电表,需要人工入户记录,容易造成数据错误,甚至数据丢失,造成经济损失。供电局需要一种智能的抄表方式以减少数据错误进而减少经济损失。针对现状,当地提出了通过识别摄像头采集的电表类型,进行图像分类,再根据类型模板读取电表数据的方案。
AI模型训练步骤
为保证模型的准确性,样本数据通常数量很多,iDesktopX可快速创建图像分类的样本库,批量导入样本图片,设置样本类别后对电表样本图片进行批量分类,用来制作图片类别的标签。样本数据制作完成后,将其导出为固定格式的样本库,作为模型训练的训练数据。
样本制作与管理
图像分类基于EfficientNet模型进行训练。EfficientNet是谷歌新一代高性能卷积神经网络,该模型能够改变深度卷积网络的宽度、深度、分辨率进而寻找更高精度模型,使得模型以极少的计算量达到极高的准确度。EfficientNet模型在图像的语义分割、目标检测都有较高的精准度。
在此项目中,使用步骤一中导出的样本库进行模型训练,同时通过验证数据集对训练模型进行不断的迭代评估,以达到实际的应用准确度要求。由于模型训练过程涉及复杂数值计算,样本数据量大、迭代次数多时,模型的训练耗时较长,推荐使用支持GPU计算的服务器进行模型训练。
iDesktopX 10i中进行模型训练示意
iDesktopX训练好的模型,可以直接在桌面端进行应用,也可以将模型转换为适用移动端的模型,便于开展外业工作。
AI模型推理应用
基于训练好的模型,对待分类的图片进行模型推理,输出分类结果为CSV文件,记录每张图片的类别及可信度。
SuperMap提供的模型应用引擎支持CPU和GPU两种计算模式,推荐使用GPU模式。除了支持接收原生训练输出的模型,也支持第三方框架输出的模型,提高了实际项目执行的灵活度。
桌面端图像分类结果
转换后的移动端模型,应用在移动端辅助巡检与智能识别,取代人工记录或传统巡检手段。只需使用移动设备进行拍照,就可以自动识别获取电表类别,并归类存档,方便后期根据类型模板自动读取电表数据。
移动端模型应用结果
小结
图像分类是计算机视觉中最基础的任务之一,在GIS领域也有较多的使用场景。SuperMap基于高层视觉信息,采用EfficientNet深度网络模型,提取图像中的抽象语义信息,进而实现图像分类。
SuperMap iDesktopX 10i中提供了完整的图像分类流程工具:样本制作、模型训练、模型推理。
iDesktopX 10i 图像分类完整流程示意
同时,模型训练、模型转换以及桌面端的模型应用,可构建地理处理模型,实现自动化执行,一键运行即可得到图像分类结果。
图像分类地理处理模型
2020 GIS 软件技术大会,点击上图即刻报名!
【相关阅读】
▼
【精彩阅读】
▼
欢迎转载~