查看原文
其他

AI界出了只话痨的小熊猫,把Midjourney们都打败了

AI沃茨 卡尔的AI沃茨
2024-11-06

 过去一周,一个神秘模型伪装成小熊猫,以评分1172获得#1名,击败了FLUX1.1、Midjourney v6.1等一系列主流模型 

一开始我还在猜是不是 Midjourney 把憋了半辈子的 V7 放出来了,

或者是 OpenAI 把 DALLE3.5 做出来了。

结果,出乎意料,竟然是一个新面孔“英国公司 Recraft”训练出来的模型:

Recraft V3

四大模型对比🆚

我只能说,AI 界还在持续上演奇迹。

一刷到体验网站,我就拿着祖传测试集准备开跑了。

刚打开界面,我人就傻了。

不是新手必备的 discord,也不是 GPT 的对话界面。

它是一张画布,一张可以无限拓展的画布

不慌,看了十页使用说明后,我花了200积分做出了使用指北。

现在,让我来一一分享使用体验。


一、无限长文

除了生图的质量,官方指出了几点重要功能:

  • Recraft V3 是世界上唯一可以生成长文本图像的模型
  • 能在图像里指定文本大小、位置和样式
  • 允许用户上传一组图像来设定生图风格
我最想复刻出来的一张图

这么多字儿,头回见那么话痨的模型,我也来复刻出来一张:

这个文字效果的稳定效果确实可以,而且生成图像的过程很简单:拉出一个固定尺寸的画框,选择合适的 V3 模型,输入你的提示语,DONE。


二、文本控制

我第二想复刻出来的图

这个图的文字效果设计感很强,我刚开始以为会有一系列关键词,

就例如是,在控制位置输入上下左右底层顶层,然后再控制大小超大杯、大杯、中杯,这种感觉的提示语,

但实际上操作要更直观,也更简单,

同样是拉一个画布出来,将产品图覆盖到画布上,然后加上文字标题,都不需要输入提示语。

Bingo,一张海报出来了。


文字的配色和速度感都延续了原图的风格。



三、自定义风格

这个功能埋很深,我差点就没找出来。

说白了就是上传几张图片,然后它会提取出这几张图片的关键元素,从而生成一种包含这些元素的新风格。

跟 Midjourney 上传参考图片还不太一样,

Recraft V3 很风格化,

元素的学习能力非常强。

就看这张图,大规模的镭射材质、紫色过渡、星光都是我设计 logo 的思路。

而且苹果不是刚刚出了Mac Mini M4 嘛,

我觉得可以做几张苹果风的壁纸搭配一下。

大家觉得这个元素风格,它学到几分了。

写在最后

超开心又能看到 AI 生图领域有新玩家崛起,

而且还是将模型植入到一个设计平台当中。

讲道理,Midjourney 占领生图领域太久了,

急需这样多样化的工具出现来卷一卷生图的功能。

而且,我一直都很向往 AI 透明化,或者说是 AI 常态化。

它不需要局限于一个对话界面,

语音助手,可调节画布,一键修复,视频翻译……

它会以各种各样的形式融入到应用中。

前天 Runway CEO 宣布 Runway不再是 AI 公司,而是一家媒体与娱乐公司。

看到这句话的时候,我在想,

当现在的 AI 应用们,

脱掉 AI 这顶帽子后,

才算是真正融入到人类的生产领域,

成为一种全新的、独一无二的内容创作方式。

@ 作者 / 卡尔@ 动手学AI知识库 / learnprompt.pro


最后,感谢你看到这里👏如果喜欢这篇文章,不妨顺手给我们点赞👍|在看👀|转发📪更多的内容正在不断填坑中……

今日份的彩蛋登场公众号回复小熊猫领取

继续滑动看下一个
卡尔的AI沃茨
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存