不建议新手上来就硬啃 Prompt
要说在 AI 浪潮下,哪个词最火,莫过于是「Prompt」。
Prompt,顾名思义就是「提示」的意思,也被戏称为咒语。
简单来说就是你给 AI 的指令,然后 AI 根据这个指令给出对应的东西。
在今年多个生成式 AI 接踵而至的时候,哪怕没有技术基础的人,都了解到 Prompt 是何物了「Prompt」提示词,这个词大家应该不陌生。
它可以是一段文字,比如你跟 ChatGPT 等对话模型沟通时候用到的。它也可以是相关的参数描述,比如你用 Midjourney 等 AI 绘图工具生图要用到的。
这么做,可以让 AI 更懂你要什么,Prompt 越精准,你离自己想要的东西也更接近。
基于此,现在玩生成式 AI 的人,都在强调 Prompt 的重要性。
那作为新手,上来就必须 Prompt,必须去记忆别人给出的 Prompt 吗?
下面这篇分享源于我们「ChatGPT&AI 赋能商业」星球社群的成员@Shadowy,跟大家谈谈不学习Prompt,而是原地躺平的理由。
以下是分享原文:
1、
聊一些轻松愉快的奇谈怪论,反弹琵琶。
作为在机器学习和 NLP 领域工作多年的专业码字机,我其实非常不建议新手上来就硬啃 prompt。
偷懒同样也是一种学习进步方式,能用工具就用工具,能躺则躺,先了解 AIGC 能做到什么,还有哪些工作未来会被 AI 化。
是不是非常反直觉?
现阶段你想要把 ChatGPT、Midjourney 之类的工具用好,拿个咒语大全天天对着背诵实践,是大多数人推荐也认可的学习路径。
这么想,其实存在一个很大的问题。
即,它不符合 IT 工具发展的底层逻辑。
2、
工具是什么?你可以认为它是一种媒介和交互手段,帮助人类间接达成某种目标。
所有的工具,都是为了目标服务的。
这个目标是完成某项任务,写论文,画画,找个靠谱的餐馆等等。
绝大多数场景下,没有最终目标,或者目标不能达成,工具也就失去了存在的必要性。
为什么 ChatGPT 能成功破局?因为它在这个基础上,还具备一个好工具的素质:
首先,交互模式简单,自然语言对话描述,门槛低,人人都会;
其次,过程链路短,多数情况下直达结果;
当然这里也可以换种方式表达,说它减少了传播途中信息损失造成的歧义和模糊等等。
纵观历史上工具的发展,从键盘鼠标到智能家居语音控制 VR 游戏,所有这些,无疑都沿着「好工具」的标准演进:交互模式更加傻瓜暴力,学习成本使用门槛更加降低。
就像奇幻作品里常有的设定,如果一个人可以靠朝你扔一句咒语去除你武器,那么他为什么还要冒着生命危险跑到你身边被你刺一剑?
3、
Prompt,也就是提示词,必然是发展过程中一个短暂的阶段性产物。
OpenAI 大牛云集,不会想到大部分用户很难理解这个提示词组合,那个 Prompt 规则,尽快改进改进,拓展它的用户群体吗?
想要乘上风口的程序员,不会觉得这地方很繁琐,我给你做个一键脚本,可视化点点点吗?
如果直接意念交流,闭上眼睛就能画画,那我为什么要背提示词。
好了,你说你没事做也不想找工具,非得卷,要先人一步做 Prompt 小达人。
那去硬背提示词也不是最合适的路径,因为它本来就是人为的,有偏的(biased)。
Prompt 的本质是什么?拿画图模型举例,它在底层模型里,代表的是训练数据中的图像标签。数据民工给图片标注了啥标签,啥就成了最终你看到的提示词。
如果训练的素材图里,苹果的数量很少,那么你的提示词写苹果,模型就不能很好地画出来。你总不能期望它画个没见过的东西。这也是为什么有的模型擅长画二次元美少女,有的擅长画真人,受到的教育不一样。
那么,你学习 Prompt 的重点,从根源上,应该立足于知道特定模型里哪些提示词数据充足被训练得很好,哪些提示词没有素材不行。
可以问模型作者,到模型下载页面去找,问 New bing和 Bard,问它这个模型的原始数据来自哪里。比如很多二次元模型,都是基于 danbooru 的原始数据。
4、
最后,去理解和想象怎样是自然的,接近更原初的艺术创作状态。
如果你是个艺术家创作者,你的直观感知力可能远超程序化的指令,奋力理解机械化的模式,反而对身心有害。
不妨抛下一切,试试凭直觉走,自我迭代学习。
多写点咒语,逐个 Prompt 加词,调整参数,观察画面和你预想的差距。
这种方法看似笨拙,但慢即是快,还能潜移默化地提升自己对数字艺术创作的理解。
就像学习板绘到了后期,看着图上的颜色,能大致戳出它在色板的位置一样,调整会变成一件发自本能的行为。
认识的很多美术大佬已经在这个阶段了。
我自己调参的时候,也几乎只看画面。
要知道这些创作工具,最终永远要服务于使用它最多的群体。
一切的喧嚣,终将回归平静。
你也一定可以。
祝大家学习顺利,收获愉快。
你还可以看: