CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法
以下文章来源于我爱计算机视觉 ,作者CV君
加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动!
同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。点击文末“阅读原文”立刻申请入群~
CVPR2019 accepted list ID已经放出,极市已将目前收集到的公开论文总结到github上(目前已收集510篇),后续会不断更新,欢迎关注,也欢迎大家提交自己的论文:
https://github.com/extreme-assistant/cvpr2019
今天为大家推荐一篇人体姿态迁移算法~
作者 | CV君
来源 | 我爱计算机视觉
今天跟大家重磅介绍华中科技大学刚刚开源的一款人体姿态迁移算法,其基于GAN思想构建,效果好到简直令人不可思议,论文《Progressive Pose Attention Transfer for Person Image Generation》已中 CVPR 2019 Oral,非常值得一读~
作者信息:
论文出自华科白翔老师组,作者单位分别为华中科技大学、微软Redmond,中兴集团。
什么是姿态迁移?
简单点说,就是给定一幅含有人物的图片和一个目标姿态,将图片内人物转换成目标姿态的样子。当然目标姿态可以是从其他图片人物中计算得来的。(所以也可以将一幅图片的人物转成另一图片内人物的姿态)
这听起来就是一项黑科技。
很显然这是一个很有趣的应用,比如给定一幅人物图像,可以将里面人物按照另一段视频里的人物变换姿态。只需要一幅你的图片,就能让你跳出优美的舞蹈~
不过,毕竟一幅图片信息有限,转换后不会惨不忍睹吧。
下图是该论文算法实现的效果(请务必点击查看大图!)。这里的目标姿态使用线段连线表示。
难以置信,图片下面6幅生成的结果图片是靠左边的一幅图生成出来的!点击大图查看,你会发现细节很清晰!
尽管只有侧颜侧身照,但不耽误我们360度看美女^_^是不是很神奇~
算法原理
首先我们先看看作者在这个过程中使用的数据,首先是一幅图片Condition image Pc,与该图片中使用姿态估计算法提取的姿态Condition Pose Sc,还有目标姿态Target Pose St。
作者提出了一种称之为Progressive Pose Attention Transfer(渐进的姿态注意力迁移)模型。
作者基于GAN思想构建算法。对于输入的人物图片和姿态,生成新的人体姿态图片和姿态,并有两个判别器,一个纹理判别器一个形状判别器,判断生成器生成的人物图片和姿态是不是真实的。
姿态迁移是由生成器完成。下图表达了作者设计的生成器的算法架构。
在Pose-Attentional Transfer Network中含有多个Pose Attentional Block,其作用是对输入的image pathway和pose pathway按照Pose Mask进行更新,图中Mt即为Pose Mask,它引导网络将图片中人物的不同的部分按照目标姿态进行像素块迁移。
将最后一个Block中Image Pathway的数据经过解码网络,即得到了最终的生成图像。
实验结果
作者在DeepFashion与Martket-1501数据集上进行了实验。在训练阶段,分别在这两个数据集上构建了263632和101966样本对。文中评价指标不再细述。
下表是该文算法与已有算法的量化比较:
可见该文算法在绝大多数评价指标下都取得了最好的结果。
下图是与其他算法的效果图比较,可见视觉上该文算法比以往算法都更加自然。其中可见右上人物的背包保留的最为真实。
另外姿态迁移本身是不好用数值量化的,最好的评价是人眼的感知。所以作者又做了个用户调查,邀请志愿者对三种算法的生成结果进行盲评。
下表是用户调查的结果:
可见,该文算法生成的结果被认为是最为真实。
下图为参数量和速度的比较。Titan X GPU上跑的实验。
该文算法在效果最好的同时,参数量最少,速度最快!
最后作者用该文提出的算法对行人图片进行姿态迁移,为行人重识别生成训练图片。
使用这种增广样本训练的行人重识别算法获得了显著的精度提升。
用这套算法,可以为行人重识别无限扩充样本了!
作者已将代码开源!感谢作者的开源分享,欢迎大家试用并在Github上Star该工程~
论文地址:
https://arxiv.org/abs/1904.03349#
代码地址:
https://github.com/tengteng95/Pose-Transfer
*延伸阅读
人体姿态估计做到今天,还有哪些「硬核场景」、「性能瓶颈」、「新战场」上的难题?
CVPR2019 | 微软、中科大开源基于深度高分辨表示学习的姿态估计算法
CVPR2019 | AlphaPose升级!上海交大卢策吾团队开源密集人群姿态估计代码
点击左下角“阅读原文”,即可申请加入极市目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群,更有每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流,一起来让思想之光照的更远吧~
觉得有用麻烦给个好看啦~