AI绘图实践-用人工智能生图助力618大促
前言
现在各种AI大模型大行其道,前有GhatGPT颠覆了我们对对话型AI的原有印象,后有Sora文生视频,让我们看到了利用AI进行创意创作的无限可能性。如今各大公司和团队都争相提出自己的大模型,各种网页端和软件应用也极大地降低了我们使用AI作为生产力的门槛。本文就为大家带来使用AI进行绘图的入门实践,为大促文章配图,绘制大促广告宣传海报,提升促销图的画质和精度,探索从这方面助力大促的新思路。
前言
现在各种AI大模型大行其道,前有GhatGPT颠覆了我们对对话型AI的原有印象,后有Sora文生视频,让我们看到了利用AI进行创意创作的无限可能性。如今各大公司和团队都争相提出自己的大模型,各种网页端和软件应用也极大地降低了我们使用AI作为生产力的门槛。本文就为大家带来使用AI进行绘图的入门实践,为大促文章配图,绘制大促广告宣传海报,提升促销图的画质和精度,探索从这方面助力大促的新思路。
01 平台
在今年的敏捷团队建设中,我通过Suite执行器实现了一键自动化单元测试。Juint除了Suite执行器还有哪些执行器呢?由此我的Runner探索之旅开始了!
现在的AI绘图主要用到的模型是SD(Stable Diffusion),它是一种稳定扩散模型,用于生成高质量的图像。这种模型是在传统的扩散模型DDPMs(Denoising Diffusion Probabilistic models)的基础上发展出来的。
国内有:
Liblib Ai:https://www.liblib.art/
MJ:https://mj.wxcbh.cn/home/?from=AI05&strategy=drawing5&bd_vid=17724435435623318479#/mj
都不需要魔法 。国外的像:
Playground AI:https://playground.com/ ,每天有免费的体验次数,速度和质量也不错。这类网站一般都有自己的模型市场,以供创作者们上传和下载自定义的模型,并且分享自己的绘图作品以及相关生图的参数,非常方便。但是一般都会收费,都会收费,都会收费,重要的事情说三遍。3.PC端软件,这类软件一般也是基于SD模型进行封装,可以下载模型,设置参数并在本地生成图片,使用体验类似于PS等图片处理软件,但是由于整个生成过程在本地执行,比较依赖于本机算力,电脑性能不好的话生成会很慢,但是好处就是自定义程度相对较高,而且一般免费。02
生图软件
理解,首先 MCube 会依据模板缓存状态判断是否需要网络获取最新模板,当获取到模板后进行模板加载,加载阶段会将产物转换为视图树的结构,转换完成后将通过表达式引擎解析表达式并取得正确的值,通过事件解析引擎解析用户自定义事件并完成事件的绑定,完成解析赋值以及事件绑定后进行视图的渲染,最终将
这次主要介绍软件的途径,使用的软件就是这款Draw Things,Mac端App Store免费下载,不需要魔法。
界面是这样的:
模型
模型是AI绘画的基础,一般的模型都是基于SD改进的,SD模型也有V1.0、V1.5、V2.0、V2.1等不同的迭代版本,不同的模型可以生成不同风格的图片,可以根据自己的需要进行选择,模型可以在DrawThings里进行下载和选择,当然也可以在Liblib Ai等网站上下载然后导入。
chekpoint(检查点)
它是完整模型的常见格式,模型体积较大,一般真人版的单个模型的大小在7GB左右,动漫版的在2-5个G之间。决定了图片的整体风格。chekpoint的后缀名是safetensors
Lora
Lora的后缀名也是safetensors,所以在安装的时候要注意,Lora要在规定的地方导入:
Hypernetwork(超网络)
采样器
DDIM和PLMS是早期SD专为扩散模型而设计的采样器。DPM和DPM++系列是专为扩散模型而设计的新型采样器。DPM++是DPM的改进版。
Euler a 比较适用于图标设计、二次元图像、小型场景等简单的图像数据生成场景。
DPM和DPM++系列非常适用于三维景象和复杂场景的描绘,例如写实人像。
Karras系列是专为扩散模型而设计的改进版采样器,有效提升了图片质量。
步数
随机种子
提示词
提示词是生成图片时关键中的关键,它直接决定了图片内容,画面风格,场景,表情动作等一系列内容,在生成图片时,选择合适的提示词至关重要。
提示词分为“正向提示词”和“反向提示词”,“正向提示词”代表你想要在图片中呈现的内容,反之“反向提示词”则是不想要在图片里具备的要素。
比如,我想要画一张“618西瓜大促”相关的宣传图,我就可以这样描述:
“许多人在湖里流动的水边吃西瓜,高质量的微型摄影”,翻译成英文:“Many people eat watermelons by the flowing water in the lake, with high-quality miniature photography”
“反向提示词”一般有:低质量,不适合上班时间浏览(NSFW),描绘人物的时候,糟糕的眼睛,多余的手指,扭曲,变形等等
其他
还有一些其他的参数,比如图片分辨率和比例,文本指导强度(越高越忠实呈现文本内容),以及一次生成的图片数量等等
03
二次处理
理解,首先 MCube 会依据模板缓存状态判断是否需要网络获取最新模板,当获取到模板后进行模板加载,加载阶段会将产物转换为视图树的结构,转换完成后将通过表达式引擎解析表达式并取得正确的值,通过事件解析引擎解析用户自定义事件并完成事件的绑定,完成解析赋值以及事件绑定后进行视图的渲染,最终将
如果对生成的图片有些细节不满意,可以利用“图像到图像”模式,然后选择强度。高分辨率修复的重绘强度为0时不会改变原图,30% 以下会基于原图稍微修正,超过 70% 会对原图做出较大改变,1 会得到一个完全不同的图像。
重绘图像元素
如果对图像中某部分的元素不满意,可以用“橡皮擦”擦除该部分,然后重新生成,让模型自动将擦除的部分重绘,甚至可以消除某部分图像元素,实测效果甚至好于PS。
扩图
对于一张图片,如果想要扩展边界部分,让模型绘制出额外的内容,可以首先重新设置图片的宽高。这里原图片是1088*2048,想要扩展左侧湖里的景象,就可以先将图片宽度增加到1536,然后移动图片到右侧贴紧图层边缘。然后最关键的一步,用“橡皮擦”工具,沿着想要扩展的那一边,细细的擦一道,这么做的目的是告诉模型,从这一部分开始重绘,风格要按照擦除的这部分来进行,然后重新生成图片。
提升画质
好了,本篇利用AI绘图进行实践的文章就介绍到这里,希望能够帮助到大家。在以后大促文章配图,和大促海报绘制方面为大家提供便利,助力大促再创新高!
进程还在,JSF接口不干活了,这你敢信?
生成式推荐系统与京东联盟广告-综述与应用
利用大模型服务一线小哥的探索与实践