问国家卫健委和国务院联防联控机制四个问题

这样的标准上海市疫情防控工作领导小组也好意思发布出来?

伊朗著名美女明星、奥斯卡影后被捕!

母子乱伦:和儿子做了,我该怎么办?

阳了后,14亿人民才发现集体被忽悠了!

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型

专知 2022-12-12

扩散模型(DMs)在高质量图像合成中显示出巨大的潜力。然而,在制作复杂场景的图像时,如何正确地描述图像的全局结构和对象细节仍然是一个具有挑战性的任务。在这篇论文中,我们提出了Frido,一个特征金字塔扩散模型执行多尺度粗-细去噪过程的图像合成。我们的模型将输入图像分解为尺度相关的矢量量化特征,然后进行从粗到细的调制生成图像输出。在上述多尺度表示学习阶段,可以进一步利用文本、场景图或图像布局等附加输入条件。因此,Frido也可以用于条件或交叉模态图像合成。我们在各种无条件和有条件的图像生成任务上进行了广泛的实验,从文本到图像合成,从布局到图像,从场景到图像,到标签到图像。更具体地说,我们在五个基准上获得了最先进的FID得分,分别是COCO和OpenImages上的布局到图像,COCO和Visual Genome上的场景到图像,以及COCO上的标签到图像。

https://www.zhuanzhi.ai/paper/d6197fd1315f12b3d3cd40944d4d9272


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“FRIDO” 就可以获取【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型》专知下载链接

                       
专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“阅读原文”,了解使用专知,查看获取100000+AI主题知识资料

文章有问题?点此查看未经处理的缓存