深度学习能辨识壁画上的艺术元素吗?
图片来源网络
在古丝绸之路的敦煌,一座莫高窟,即拥有4.5万余平方米古代壁画,这些古代壁画是人类最为瑰丽的珍宝,也是列入《世界文化遗产名录》的文化遗产。壁画的艺术元素鉴别、创作时代鉴定、绘画风格规律分析、壁画修复等构成文化遗产研究与保护的重要工作。其中,对壁画中的艺术元素实例进行自动分类与识别是后续高层模式识别与艺术内容鉴定的关键技术。
今天图图带大家阅读《中国图象图形学报》2020年第1期封面论文《特征融合AlexNet模型的古代壁画分类》,成果来自太原科技大学计算机科学与技术学院曹建芳老师团队。
题目:特征融合AlexNet模型的古代壁画分类
作者:曹建芳, 崔红艳, 张琦
关键词:壁画分类;特征融合;AlexNet模型;卷积神经网络;壁画数据集
引用格式:曹建芳, 崔红艳, 张琦. 2020. 特征融合AlexNet模型的古代壁画分类. 中国图象图形学报, 25(1): 92-101
全文链接:
壁画,是墙壁上的艺术,有石窟壁画、寺观壁画、墓室壁画等。中国古代壁画艺术,兴起于汉晋,盛于唐宋,延至明清,是历史最悠久的绘画形式之一。作为建筑物的附属部分,其装饰和美化功能使它成为环境艺术的一个重要方面。
壁画内容涉及广泛,包含宗教、政治、历史、经济、文化、医学和社会生活等广阔领域,从佛经、教义、神话传说、历史故事、生活场景到山水风光、翎毛花卉、图案装饰等几乎无所不包,内容丰富多彩。
随着计算机技术图像处理方向的不断发展和推广,古代壁画图像也向着数字化时代迈进,如何有效利用这些海量数字资源是一个亟待解决的问题,首要需求就是确定研究对象。
对壁画图像进行分类研究,方便研究者快速有效地从数字壁画库中搜索目标图像,以便对壁画图像进行有序管理和保护。传统特征的提取方法有一定的效果,但需要丰富的先验知识,同时提取到的特征会存在表达不充分和泛化能力不强的问题。
2012年AlexNet网络的问世,深度学习(Deep Learning)成为主流,已经有实验证明在大规模的图像分类上,深度学习技术已经远远胜过了传统的特征编码方法。尤其卷积神经网络深度学习能自主提取特征,从底层的视觉特征抽象到高层的语义特征。
图片来源网络
因此,论文将卷积神经网络用于壁画分类,借鉴经典卷积神经网络AlexNet网络结构,综合考虑壁画数据量和网络结构的影响因素,通过对比实验确定模型参数,提出一种既具有纵向延伸,又兼有横向扩展特点的卷积神经网络模型来实现壁画图像的自动分类。基于特征融合AlexNet的壁画图像分类模型
首先,提取壁画图像第一阶段的边缘等底层特征;
其次,采用结构不同的双通道网络对提取的第一阶段特征进行第二阶段的深层抽象,得到两个通道的特征;
最后,融合两个通道的特征,共同构建损失函数得到分类结果,从而提高模型的鲁棒性和特征表达能力。
论文所有数据均来自《中国敦煌壁画全集》和《中国丝绸之路的墓室壁画》画册的扫描版,时间上从汉代沿革到清代,地域上跨越了东部、中部和西部,涵盖了不同朝代不同地区的壁画题材。
通过对收集的古代壁画艺术图像进行研究,将数据集的类别设定为佛像、菩萨、祥云、世俗人物、佛弟子、动物、植物和建筑等八类艺术形象。论文对采集到的数据使用缩放、亮度变换、加噪和翻转等数据集增强算法来进行扩展。
不同形象图像示例
不同朝代图像示例
不同地域图像示例
在所构造的壁画图像数据集上,论文模型最终达到了85.39%的准确率。
与未进行预训练的经典模型同时运行1万步的比较结果如下图所示。可看出论文网络结构不易产生过拟合现象,究其原因主要是其他网络都属于大型的深层次模型,训练参数大,耗时较大,同时对图片数量要求比较严格,当数据集较小时容易产生过拟合,提取的特征不能充分表达壁画特征。
与结合预训练的经典模型相比,准确率大致有1%-5%的提升,如下图所示。主要是由于论文模型并未在ImageNet这样的大数据集上进行预训练,而是直接从壁画图像自身开始训练模型,提取的特征更贴合壁画图像特征,说明自然图像与融合了人的主观设计思想的壁画图像在特征提取方面还是有一定的差距。
整体来看,论文方法从硬件条件、网络结构和内存消耗上来说代价更小。
曹建芳,博士,教授,太原科技大学硕士生导师,忻州师范学院科研处副处长。
主要研究方向为数字图像理解、大数据技术等。所带领的古代壁画图像智能修复关键技术研究团队,主要致力于从事图像分析与模式识别、壁画图像数字化传承与保护、五台山文化等领域的研究工作。
E-mail:kcxdj122@126.com
崔红艳,硕士研究生,主要研究方向为机器学习与数字图像处理。
E-mail:1294865211@qq.com
张琦,硕士研究生,主要研究方向为数字图像理解。
E-mail:806660935@qq.com
图片来源网络
为了探究深度学习算法在数字壁画修复上的应用前景及问题,图图访问了西南林业大学的强振平老师和云南大学的徐丹老师,点击深入阅读:
深度学习可能成为新的“壁画医生”吗?
全民抗疫我倡议
工作学习之余,也要适当休息,调剂大脑,图图今天跟大家分享这首周杰伦的《梯田》,也许它会带给我们一些思考。
怎么梯田不见多了几家饭店
坐在里面看着西洋片
几只水牛却变成画挂在墙壁上
象征人们蒸蒸日上
一堆游客偶尔想看看
窗外的观光景点
但只看到
比你住的再高一层的饭店
自私的人类狼不狼狈
破坏自然的生态会不会很累
森林绿地都已成纪录片
闻不到绿意盎然
只享受到乌烟瘴气
是不是只能用相机纪录自然
拿相片给下代回味
可怜可悲
每个冬天的句号都是春暖花开
热爱生命 敬畏自然
图片来源网络
如果您有居家学习的经验要分享,有故事想倾诉,有写作问题想寻求解答,欢迎添加下方学报小编微信,我们在一起。
本文系《中国图象图形学报》独家稿件
内容仅供学习交流
版权属于原作者
欢迎大家关注转发!
编辑:秀 秀
指导:梧桐君
审校:夏薇薇
总编辑:肖 亮
❂ 好文推荐
前沿进展 | 多媒体信号处理的数学理论
中国卫星遥感回首与展望
单目深度估计方法:现状与前瞻
目标跟踪40年,什么才是未来?
10篇CV综述速览计算机视觉新进展
算法集锦 | 深度学习在遥感图像处理中的六大应用
封面故事 | AI看图说话,智慧图解春意封面故事 | 从传统到深度:火灾烟雾识别综述
封面故事 | 光场数据压缩综述
学者观点 | 结合深度学习和半监督学习的遥感影像分类
编辑推荐 | 视频 + 地图!四维信息助力实景中国
深度学习+图像降噪,如何解决“卡脖子”问题?
❂ 专家报告
专家推荐|高维数据表示:由稀疏先验到深度模型
专家报告 | AI与影像“术”——医学影像在新冠肺炎中的应用
专家推荐|真假难辨还是虚幻迷离,参与介质图形绘制让人惊叹!
学者推荐 | 深度学习与高光谱图像分类【内含PPT 福利】
专家报告|深度学习+图像多模态融合
专家报告 | 类脑智能与类脑计算
100页PPT!道尽Pansharpening 的数学建模机理
200+PPT!带你读懂深度网络模型与机理实战例题!200+PPT带你看懂监督学习
118页PPT!机器学习模型参数与优化那些事儿~
专家开讲 | 机器学习究竟是什么?
❂ 论文写作
Hinton,吴恩达,李飞飞 !大师深度学习课程集锦
羡慕别人中了顶会?做到这些你也可以!
如何阅读一篇文献?
共享 | SAR图像船舶切片数据集
资源分享| 不知道如何获取最新的算法资讯?快来这里看一看
资源分享|热门IT资讯号推荐
❂ 往期目次
《中国图象图形学报》2020年第2期目次
《中国图象图形学报》2020年第1期目次
《中国图象图形学报》2019年第12期目次
《中国图象图形学报》2019年第11期目次
《中国图象图形学报》2019年第10期目次
声 明
欢迎转发本号原创内容,任何形式的媒体或机构未经授权,不得转载和摘编。授权请在后台留言“机构名称+文章标题+转载/转发”联系本号。转载需标注原作者和信息来源为《中国图象图形学报》。本号转载信息旨在传播交流,内容为作者观点,不代表本号立场。未经允许,请勿二次转载。如涉及文字、图片等内容、版权和其他问题,请于文章发出20日内联系本号,我们将第一时间处理。《中国图象图形学报》拥有最终解释权。
与你同在
前沿 | 观点 | 资讯 | 独家
电话:010-58887030/7035/7418
网站:www.cjig.cn