其他

想让AI读懂时尚?看看亚马逊新发的这两篇论文

2017-08-25 专注报道AI 量子位
安妮 编译整理
量子位 出品 | 公众号 QbitAI

亚马逊想让AI读懂时尚。

在Echo Look中加入穿搭指导功能引发大量吐槽后,目前,亚马逊又发表了两篇与时尚相关的研究。

洛杉矶亚马逊实验室近日发明了一种从图像中学习服装风格算法,可以从头开始设计风格相似的衣服。

与此同时,以色列的亚马逊研究人员正在用机器学习开发一种新技术,它能够通过分析几个附在图片上的标签判断这套服装是否流行。

这两项研究的相关论文均在上周于加拿大哈利法克斯举行的KDD 2017大会上公布。其所在的workshop探讨了计算机视觉、机器学习和其他先进技术如何在时装业中使用,看来AI是立志要在时尚界搅点新潮流出来了。

听起来都燃,但距离这些的技术影响你的衣柜还需要一段时间。

论文概述

洛杉矶团队发表的论文题为《Toward beter reconstruction of style images with GANs》,以色列团队的论文题为《Learning Fashion Traits with Label Uncertainty》。量子位将两篇论文的摘要等重要部分编译整理如下:

用GAN重建服装图像

近日用生成式对抗网络(GAN)做逆映射的浪潮兴起,也就是让数据从数据空间逆映射到潜在空间。这种映射能对图像进行重建,无论是编码还是解码,都能在紧凑的潜在空间完成。框架中损失函数的选择对重建的质量至关重要。

在这篇论文中,我们摸索了损失函数可能的选择,并将此应用到图像风格的定性评估上。同时,我们也引入了一种损失函数,惩罚不完美的潜在空间重建并使它和双向编码和生成不同风格图片的GAN框架。实验证明,这种惩罚帮助重构出更现实的图像。

在这篇文章中,我们重点关注编码和解码服装图像,对GAN重构图像尤其感兴趣——也就是将图像通过编码映射到潜在空间,之后再通过解码将隐藏代码映射到图像空间,从而重构原图创造出与原风格相似的图像。

在实验中,我们摸索了损失函数可能的选择,并将此应用到图像风格的定性评估上。同时也引入了一种损失函数,惩罚不完美的潜在空间重建并使它和双向编码和生成不同风格图片的GAN框架。实验证明,这种惩罚帮助重构出更现实的图像。

如果我们重建的图像效果良好,即可被应用在很多地方,可以在潜在空间中轻松改变某个图像的风格。比如虚拟试衣,这就是重建特殊服装图像的实例。

学习标签不确定的时尚特征

我们想根据图像预测主观的时尚特征,同时对理解哪套服装更适合用户这个任务尤其感兴趣。因为这些特征因人而异,非常主观,所以这个任务自带很多噪音。

一个解决方案是为每个样例做多次注释,但是这样很难收集大量数据。出于可行性的考虑,大数据集中的样例只有少数的人为标记。因为标签是用少量人为标记预测的,所以这种方法引入了不确定的样例。

我们提出一种封闭式模型模拟副次抽样所引起的标签不确定性,结果显示模型基本具备从时尚相关的噪声数据中量化学习算法的能力。我们进而用此模型构建了自定义神经网络损失函数,让它能更好地学习时尚特征。

最后,附论文下载地址——

GAN重建服装图像:

https://kddfashion2017.mybluemix.net/final_submissions/ML4Fashion_paper_13.pdf

学习时尚特征:

https://kddfashion2017.mybluemix.net/final_submissions/ML4Fashion_paper_14.pdf

加入社群

量子位AI社群7群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot2入群;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进群请加小助手微信号qbitbot2,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存