查看原文
其他

AIGC 改变世界 | 生成式人工智能(Generative AI)是 “未来” 还是 “现在” ?

ShuYini AINLPer 2023-07-10
点击上方AINLPer,设为星标
更多干货,第一时间送达
|女神节,愿你度过美丽时光

引言

 从新一代的生成式聊天机器人,到能够生成(几乎)任何图片的模型,特别是生成式AI,AI快速发展也引起了人们无限的想象。一些企业/科研机构正在争相将AI纳入其产品、服务和流程中,希望找到自己的AI抓手。那么今天给大家分享的这篇文章也许能给您一些启发,其中本文主要涉及:生成式AI带来的改变、应用案例探索、如何看待生成式AI等三个方面。

AIGC改变世界

 最近的人工智能发展速度令人惊叹,尤其是最近chatGPT的文章刷爆了各大头条。有文章指出AI并将改变世界。那么它何时会实现呢?这里引用杜甫《春夜喜雨》中诗句:“随风潜入夜,润物细无声”。

文本生成

 语言模型能够产生连贯的文本(例如chatGPT),这感觉像是人类技术的一个转折点。同样令人印象深刻的是,这些模型能够捕捉文本(例如文章、信息、文档)的含义和上下文,以使软件更加智能地处理文本。 即使不知道它,我们每天也都在应用着大型语言模型的能力。想想谷歌翻译、谷歌搜索和文本生成模型。你最喜爱产品中的许多的应用程序和功能都在使用着大型语言模型来更好的处理语言信息,而它们不断迭代优化,每天都在变得更快、更高效、更准确。

 这些模型不仅使新功能和产品成为可能,事实上,基于这些模型作为基础的公司也正在建立全新的行业。一个明显的例子是越来越多的公司正在建立AI写作助手。这包括HyperWrite、Jasper、Writer、copy.ai等公司。另一个例子是将模型生成编入交互式体验中的公司,例如Latitude、Character AI和Hidden Door。

图像生成

 AI图像生成是生成式AI领域中另一个令人兴奋的领域。在该领域,DALL-E、MidJourney和Stable Diffusion 等模型风靡全球。

 AI图像生成其实并不是一个特别新的技术。像GAN(生成对抗网络)这样的模型能够生成人物、艺术甚至房屋的图像,其实9年前就可以做到了。但是每个模型都是专门为其生成的图像类型进行特殊训练的,生成一张图像需要很长时间。 当前的一批AI图像生成模型可以让单个模型生成多种图像类型。它们还赋予用户通过描述来控制它们生成的能力。这些工具模型通过简单的文本提示所能产生的结果远远超过了预期。这会让人产生一种强烈得感觉:认为某些事情已经变了,我们所知道的世界正在发生了某种转变,并预计对产品、行业和经济产生持久影响。这种潜力显而易见。

区分Demo与可靠用例

 潜力大的同时也需要保持一个谨慎得态度。现在经常能够看到一些“我让模型X完成了不可能的任务Y”的帖子,重要的是要用敏锐的眼光来过滤这些说法。其中一个关键问题是,该模型是否是一个可靠稳定的行为。

 目前的大型文本生成模型确实能够回答许多问题,但它们能做到结果的可靠性吗?一些人比较乐观,认为模型能够可靠地生成复杂问题的正确答案。然而Stack Overflow的官方却禁止使用chatGPT生成的答案进行回复。并且我也有尝试让chatGPT讲个笑话,结果并不理想。

 可靠性是AI能力成为面向客户的产品的关键。例如,在过去几年中,许多大型GPT模型被赋予了许多能力。例如,模型可以仅通过文本提示就能生成构建网站的代码,这在2020年就被提出。现在已经过去三年了,这些能力并不是我们建立网站的方式。

 使用语言模型进行代码生成几乎肯定会改变软件编写的方式(例如Replit、Tabnine和Copilot的用户)。然而,这是一个逐步改变的过程。上面的“几乎”可以是2年,也可以是5年。 这里可以引用比尔·盖茨的一句话:“「大多数人高估了自己在一年内可以实现的目标,低估了他们在十年内可以实现的目标」。” 对于某些新技术,人们的期望也可以这样说。上一次科技行业被深度学习所席卷的时候,我们曾承诺在2020年之前实现自动驾驶汽车,可是到现在还没有出现,然而目前也正在逐渐出现L2、L3辅助驾驶。

 令人惊奇的Demo用例不断推出。它们是社区发现这些模型局限性和可能性的过程的一部分,然而,持续质疑、认识到时间线的不确定性,并致力于AI模型的健壮性和可靠性,这也是非常有意义的,同时也符合事物的发展规律。

模型只是AI的一部分

 语言模型生成连贯文本的能力将会不断提高,很多人渐渐对语言模型也会有更客观的理解。语言模型的应用方式并不仅仅是生成文本。更有用的方式是将语言模型视为软件系统的语言理解和生成组件。它们能使得软件系统变得更加智能,能够执行超出传统软件能力的行为,特别是涉及语言和视觉方面。 在这种情况下,模型的“语言理解能力”这个术语并不是用来表示人类水平的理解和推理。而是模型能够从文本和其中的意义中提取更多的信息,以增加软件的实用性。一旦我们将模型视为一个组件,我们就可以开始组合使用多个模型从而搭建更高级的系统。

单纯的生成式AI只是冰山一角

 生成式人工智能之所以可能,是因为在大规模数据集上训练的更大、更好的模型使得人工智能模型能够更好地进行文本和图像的数字表示。对于开发人员来说,重要的是要知道这些表示方法除了生成之外,还可以开启各种可能性。 其中一个关键的可能性就是神经搜索,它将关键字搜索替换成语言模型搜索,能够极大的提高搜索效率。同时将神经搜索与文本分类一起作为人工智能产生可靠结果的用例,可以应用于许多行业用例,这就是微软Bing正在做的事情。

推荐阅读

[1] 「自然语言处理(NLP)」 你必须要知道的 “ 十二个国际顶级会议 ” !

[2] 2023年!自然语言处理 10 大预训练模型

[3] 重磅!| NLP不断突破界限,2023 十篇必读的顶级NLP论文!

[4] 有研究惊奇发现:大语言模型除了学习语言还学到了...

[5] 颠覆传统神经网络!19个神经元驾驶一辆车!

参考

Link:https://txt.cohere.ai/generative-ai-future-or-present/

点击下方链接🔗关注我们

「资料整理不易,点个再看吧」

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存