PaddleHub开源模型400+,三行代码也可实现无限AI创意梦想!
Q:最顶尖的 AI 技术到底离我们有多远?
A:三行 Python 代码的距离。
最近 AI 作画确实很火,在 DALL-E 和 Imagen 崭露头角之后,ERNIE-ViLG、Stable-Diffusion(SD)、Disco-Diffusion 相继开源开放,涌现出丰富多彩的 AI 作画作品。
ERNIE-ViLG 效果
prompt:夕阳日落时,阳光落在云层上,海面波涛汹涌,风景,胶片感
prompt:巨大的纯白色城堡
Stable-Diffusion(SD)效果
prompt:a beautiful landscape photography of snow covered Rocky mountains,a dead intricate tree in the foreground,sunset,dramatic lighting,by Marc Adamus
prompt:close-up maximalist illustration of panther,by makoto shinkai, akihiko yoshida,yoshitaka amano,super detailed,hd wallpaper, digital art
prompt:clouds surround the mountains and Chinesepalaces,sunshine,lake,overlook,overlook,unreal engine,light effect,Dream,Greg Rutkowski,James Gurney,artstation
Disco-Diffusion 效果
prompt:在 artstation 上的一幅美丽的画,一个独特的灯塔,照耀着它的光穿过喧嚣的血海
由 greg rutkowski 和 thomas Kinkade 所作
prompt:在宁静的风景中画一幅美丽的建筑画
由 Arthur Adams 在 artstation 上所作
prompt:小桥流水人家
以上惊艳的文图生成效果,是通过 PaddleHub 三行 Python 代码实现的作品:
module = hub.Module(name="ernie_vilg")
results = module.generate_image(text_prompts=["巨大的白色城堡"])
三行代码虽然简单,但是代码背后的文图生成模型可不简单,分别来源于现在文图生成领域最顶尖的开源成果:ERNIE-ViLG、Stable-Diffusion 以及 Disco Diffusion+ERNIE-ViL。以 DD+ERNIE-ViL 为例,DD 扩散模型负责从初始噪声或者指定初始图像中来生成目标图像,ERNIE-ViL 负责引导生成图像的语义和输入的文本的语义尽可能接近,随着扩散模型在 ERNIE-ViL 的引导下不断的迭代生成新图像,最终能够生成文本所描述内容的图像。这种惊艳的效果,在 PaddleHub 这里只需要三行代码即可体验。也可以通过 huggingface 的 ERNIE-ViLG 空间体验,如图:
PaddleHub 最新升级
>> 简介与特性
特性一:模型种类丰富
特性二:超低使用门槛
特性三:一键模型快速预测
特性四:一键模型转服务化
特性五:十行代码迁移学习
特性六:跨平台兼容性
>> 文本领域
包括中文分词、词性标注、句法分析、AI 写诗/对联/情话/藏头诗、情感分析、文本审核、机器翻译、同声传译等 。
>> 语音领域
支持语音识别、语音合成、声音分类和声音克隆
语音识别效果如下:
Input Audio:
Recognition Result:我认为跑步最重要的就是给我带来了身体健康。
合成效果如下:
输入:Life was like a box of chocolates, you never know what you're gonna get.
轻松服务化部署
>> 第一步:启动 PaddleHub Serving
运行启动命令:
import json
import cv2
import base64
from io import BytesIO
from PIL import Image
# 发送HTTP请求
data = {'text_prompts': '巨大的白色城堡'}
headers = {"Content-type": "application/json"}
url = "http://127.0.0.1:8866/predict/ernie_vilg"
r = requests.post(url=url, headers=headers, data=json.dumps(data))
# 获取返回结果
for i, result in enumerate(r.json()["results"]):
image = Image.open(BytesIO(base64.b64decode(result)))
image.save('result_{}.png'.format(i))
加入 PaddleHub 技术交流群
>> 入群福利
1、社区开发者充分技术沟通交流,组队参加各种创意赛事
2、获取 PaddleHub 优质项目合集,获取预训练模型发布最新资讯
>> 入群方式
1、微信扫描下方二维码,关注公众号,填写问卷后进入微信群
2、查看群公告领取福利
-ERNIE-ViLG ERNIE-VILG:UNIFIED GENERATIVE PRE-TRAINING FOR BIDIRECTIONAL VISION-LANGUAGE GENERATION https://arxiv.org/pdf/2112.15283.pdf -Sttable Diffusion [High-Resolution Image Synthesis with Latent Diffusion Models] https://arxiv.org/abs/2112.10752 -Disco Diffusion [Diffusion Models Beat GANs on Image Synthesis] https://arxiv.org/abs/2105.05233
飞桨官网:https://www.paddlepaddle.org.cn/ 文心官网:https://wenxin.baidu.com/ GitHub 地址:
Gitee 地址:
PaddleHub 大模型体验教程:
Huggingface 体验地址:
更多模型检索:
精彩赛事