这几个AI算法,我能玩一天!
大家好,我是 Jack~
2022 年的 CVPR 论文在月初就放榜了,共有 2067 篇论文被接收。
今天,给大家介绍几个,其中刚刚开源的几个好玩算法。
DualStyleGAN
高分辨率的肖像风格迁移算法DualStyleGAN
。
给定一张真人图片A
:
再给一张图片B
,就是要变换的风格:
算法会将图片A
根据图片B
的风格进行风格迁移,生成图片C
:
这个效果还不错吧?
这样我们就可以根据自己喜欢的动漫角色,对自己的肖像进行风格迁移了。
一起看下更多的算法效果:
第一列原始图像,第二列参考的风格,第三列算法生成的效果。
这个算法,可以应用到一些有头像需求的场景,提供用户一些可选的漫画风格,生成自己喜欢的肖像。
DualStyleGAN
算法刚刚开源,已获得近300
的star。
项目地址:
https://github.com/williamyang1991/DualStyleGAN
算法运行官方提供了三种方法。
没有任何编程基础的小伙伴,可以体验 Web 网页。
https://huggingface.co/spaces/hysts/DualStyleGAN
上传图片即可体验。
另外两种就是 Colab 环境和本地搭建。
Colab 不需要自己安装一些第三方依赖,有“梯子”可以直接打开运行。
https://colab.research.google.com/github/williamyang1991/DualStyleGAN/blob/master/notebooks/inference_playground.ipynb
想本地测试的小伙伴也可以本地部署,官方提供了 Conda 的环境,直接创建一个虚拟环境即可。
conda env create -f ./environment/dualstylegan_env.yaml
详细的内容,各位小伙伴直接看README
吧。
最后再放一组惊艳的效果。
RQ-VAE Transformer
经常看我文章的小伙伴,应该看过我写的 NÜWA(女娲)、DALL-E 算法。
今天要介绍的算法RQ-VAE Transformer
在文字转图片任务上效果更好。
任务就是根据一段文字描述,生成对应描述的图片。
比如:
A cheeseburger in front of a mountain range covered with snow.
雪山前的芝士汉堡。
算法根据我们的文字描述,生成对应的图片。
再比如:
a cherry blossom tree on the blue ocean.
蓝色海洋上盛开的樱花树。
算法主要分为两个阶段:RQ-VAE 和 RQ-Transformer。
前者负责编码,后者负责生成。
算法也是刚刚开源:
项目地址:
https://github.com/kakaobrain/rq-vae-transformer
本项目只支持本地环境,第三方库可以直接根据requirements
进行安装。
pip install -r requirements.txt
大家可以去体验下,有些效果挺有意思。
VFD
DeepFake 换脸技术越来越多。
换脸的图片和视频都太逼真了,有时候肉眼很难判断。
VFD
通过技术手段,可以帮助我们分析图片的真假。
它也是 2022 年的 CVPR,刚刚开源。
至于效果,大家就自行测试吧。
项目地址:
https://github.com/xaCheng1996/VFD
絮叨
从 2022 年的 CVPR 来看,3D 重建相关的,还有 Transformer 的内容,一直挺多。
后面看情况再分享一些 3D 重建的吧。
本文有用的话,来个赞喽~
我是 Jack,我们下期见!