查看原文
其他

对话Midjourney创始人:图片只是第一步,AI将彻底改变学习、创意和组织

Founder Park Founder Park 2023-07-24
Midjourney 是一家神奇的公司,11 人改变世界,创造伟大的产品。
注定会成为 Pre AGI 初年的佳话。
「我从不曾想过要一家公司,我想要有一个家。」
智源大会上,我们对话了 Midjourney 创始人 David Holz

MidJourney 是当下最炙手可热的图片生成引擎,在 OpenAI 的 DALL·E 2 和开源模型 Stable Diffusion 等激烈竞争下,目前仍保持着多种风格生成效果的绝对领先。
以下是对谈全文,经 Founder Park 编辑。
张鹏
欢迎 David,我想这是你第一次与中国的粉丝交流,你可以借此机会向他们问好。
David Holz
哈喽大家好,Midjourney 可能还没有正式进入中国,但是如果你们已经用上了 Midjourney 的话,我希望大家都可以拥有好的体验。

创业驱动力

解放人类的想象力

在过去的 20 年里,我认识了很多国内外的创业者。我发现他们有一些共同点,他们都有强烈的驱动力,驱使他们「无中生有」地探索创造。
我想知道,在你创立 MidJourney 的时候,你的驱动力是什么?在那个时刻,你渴望的东西是什么?

David Holz
我从来没有想过要创办一家公司。我只是想要一个「家」(home)。
我希望在未来 10 年或 20 年,可以在 Midjourney 这里创造那些我所真正关心的和真正想为这个世界带来的东西。
我经常思考各种各样的问题。也许我不能解决每个问题,但是我可以做出一些尝试,从而让大家都能更有能力地解决问题。
因此,我尝试去思考如何解决,如何创造东西。我认为,这可以归结为三点。首先,我们必须反思自己:我们想要什么?问题究竟是什么?
然后我们要想象:我们前进的方向在哪里?有什么可能性?
最后,我们必须相互协调,与他人合作,共同实现我们所想象的事情。
我认为,在人工智能方面,有很大的机会将这三部分结合起来,并创造出重要的基础设施,使我们更擅长于解决这个问题。在某种程度上,人工智能应该能够帮助我们反思自己、更好地想象未来的方向、帮助我们更好地找到彼此并合作。
我们可以一起完成这些事情,并将它们融合到某种单一的框架中。我认为这将改变我们创造事物和解决问题的方式。这就是我想做的 big thing。
我认为有时候(我们先做的)图片生成可能会让人感到困惑,但在许多方面,图片生成是一个已被认可的概念。Midjourney 已经成为了一个超级想象力的集合,数百万人共同探索着这个空间的可能性。
在未来几年里,会有机会进行更多的视觉和艺术探索,这可能会超过所有先前历史的探索总和。
这并不能解决我们面临的所有问题,但我认为这是一次测试,一次实验。如果我们能完成这次视觉领域的探索,那么我们也可以在其他事情上做到,其他所有需要我们一起探索和思考事情,我认为都可以通过类似的方式来解决。
因此,当我考虑如何开始着手解决这个问题时,我们有很多想法,建了很多原型,但是 AI 领域突然出现了突破性的进展,尤其是视觉方面,我们意识到这是一个绝无仅有的机会,能创造出一些别人从未尝试过的东西。这让我们想去为之尝试。
我们认为,也许过不了多久,这一切都将汇聚到一起,形成非常特别的东西。现在还只是个开始。

张鹏
所以,图片(生成)只是第一步,你的最终目标是解放人类的想象力。这是吸引你创立 Midjourney 的目标吗?

David Holz
我真的很喜欢具有想象力的东西。我也希望这个世界能有更多的创意。
每天都能看到疯狂的想法,这太有趣了。

连续创业经验

如何更好地创业

张鹏
许多人第一次认识你时并不是通过 Midjourney,而是通过 Leap Motion(David 的上一家创业公司)。
我强烈感觉到,对你来说这两个项目可能存在一些关联,无论是驱动力或心态方面,我不知道我理解得是否正确。但我想问的是,你在 Leap Motion 的经验是否有助于你创办 Midjourney?

David Holz
从很多方面来看,我从 Leap Motion 中学到了很多,比如如何组建大型研究团队、如何解决以前没有人解决过的问题、如何深入思考人们该如何与技术交互。
不仅仅是考虑速度、成本和规模,而是考虑我们该如何协作、如何共同前进。这非常重要,它是 Leap Motion 的核心思想之一。
二者有一些相似的地方,就像 Leap Motion 一样,它迅速成长,吸引了每个人的想象力,我认为 Midjourney 也类似。
但我认为二者也有一些真正不同的地方,在 Leap Motion 中,我们花了大量时间构建早期的生态系统。
在硅谷,当时有这样一种信仰,即你应该先构建一个生态系统,就像 iPhone 一样。但我认为我们共同学到的是,也许你首先要构建一个真正受人们喜欢的好产品。然后,当你完成这个产品时,你可以开始着手构建生态系统。
对于很多企业家来说,在早期构建生态系统可能会分散他们的注意力,我也是如此。因此,Midjourney 所做的一个很重要的不同的事情,就是专注于构建真正每个人都可以使用的东西。
我以前经常用「我能不能亲手完成」来判断自己的能力。我的父亲是个外科医生,他就可以做到。我们拥有灵巧的双手。
但现在我更多在思考,卡车司机会喜欢用 Midjourney 吗?有很多卡车司机在玩 Midjourney,对我来说这太酷了,这意味着我们做的更好了。

新理解知识

历史知识成为创造的力量

张鹏
这很有趣。我们通常说空口无凭,给我看你的代码(Idea is cheap, show me the code)。但现在,想法似乎才是唯一重要的东西。
只要你能通过一系列优秀的 Prompt 表达你的想法,AI 就可以帮助你实现。所以,学习和创造的定义是否正在改变?你怎么看?
David Holz
我觉得一个有趣的事情是,当你给人们更多的时间去创造时,他们也会对学习本身更感兴趣。
例如,美国有一种很流行的艺术风格叫做装饰艺术。我从来没有关心过这种艺术是什么,直到有一天,我通过指令就可以制作出这类艺术风格的作品时,我突然对它产生了很大的兴趣,想更多了解它的历史。
我觉得这是很有趣的一点,当历史成为你可以立即用起来并让你更简单地去创造的东西时,我们反而会对历史更感兴趣。
如果用户交互界面变得足够好,让用户觉得 AI 成为了我们思维的延伸。AI 就仿佛是我们身体和思想的一部分,AI 又在一定程度上与历史紧密相连,而我们也将与历史紧密联系在一起。这太有意思了。
当我们问用户他们最想要什么时,通常排在第一第二的回复是他们想要学习材料,他们不仅是想要学习如何使用工具,还想要了解艺术、历史、相机镜头、光彩,想要了解和掌握所有可用于创造的知识和概念。
以前,知识只是过往的历史,但现在,知识成为了创造的力量。
知识在当下就能立即发挥出更大的作用,人们都渴望获得更多的知识。这可太酷了。

面对恐慌

开放地思考自己的能力

张鹏
在中国,你们的用户来自于许多不同的背景,他们可能具有不同水平的艺术创作能力。像我这样的用户还在努力制作更好的图片,但我听说许多画家和设计师正在担心他们会被AI取代。
为了确保每个人都能通过AI得到助力,而不是感到困惑或被边缘化,Midjourney 可以做些什么呢?

David Holz
对于还没有开始他们艺术之旅的人来说,Midjourney 为他们提供了独特的机会。
你会开始思考:我喜欢什么?我的审美观是怎样的?我觉得什么是美丽的?
专业艺术家可能需要几十年才能做到,而现在每个人都可以做到。我们发现,人们深入反思,这几乎像是艺术治疗,让人思考他们的生活、面对的挑战、可能发生的好事或坏事,这非常有意义。
我认为大多数使用它的人都有这些个人体验,它并不是竞争性或商业性的。我们发现,大多数人使用它,只是自娱自乐。他们甚至不会分享他们生成的图片。
在专业领域,它变成了增强你创造力的放大器,现在你可以制作漫画、电影或视频游戏。
如果你是一个普通人,第一次在你的生活中思考美,那么艺术家现在可能在思考,如何创造整个世界和宇宙的故事。以前他们从未能够做到。
因此,它拓展了每个人的创造力边界
普通人有更多的能力,专业人士也有更多的能力。有时很难意识到这点,因为现在用户界面都很简单。但是它们可以变得更加复杂、强大,并具有许多功能,那些功能稍后会出现。

AIGC的魅力

就是艺术的魅力

张鹏
也许 AI 不仅仅只是用来处理一张图片,它可以帮助人们处理更复杂的工作。因为在过去,当我们谈到创造力时,里面包含了许多因素,是否有创造的欲望?要创造什么样的想法?还需要具备行动的能力,执行它使其成为现实。
但有时,如果可以解放创作欲望、伟大的想法和复杂的事物,AI 可以帮助你。这可能就是 AI 可以为人们提供的力量,而不仅仅是图像。对吧?

David Holz
这是一个非常个人化的过程,需要反思,起初我们并不知道。
一开始,我看着这些(人们生成的)图片,却不明白他们要做什么。
有人生成了一张狗在天堂的图片。
我问他为什么要做一张狗在天堂的图片?他说那是因为他的狗刚刚去世了。
我感到很难过。他说这(图片)让他感觉好些了。
人们使用它的目的几乎就像艺术疗法一样。他们思考着事情,反思着他们的生活,试图弄清楚自己是谁。我认为这是非常个人化的,非常重要的,这是一些人类历史上,大多数人都没有机会做的。只有非常少数的人有机会这样做。
我认为这非常美,能够让每个人都能够做到这一点。

张鹏
是的,Midjourney 不仅仅是我们的业务或者工作流里的一个工具,它已经成为了我们生活中的一个新元素。

11人传奇

未来五年会出现更多

张鹏
Midjourney 之所以如此美妙,是因为它将神奇的技术传递给了 1000 万人。而我知道你的团队只有 20 个人,几个月之前只有 11 个人。你们没有销售团队,没有市场团队,其中还有一些是在校生。
我很好奇,这是 AI 时代的创业公司组织形式的新范例吗?
David Holz
我想未来会的。
我们的确是(采取这类组织形式)比较早的。我们也有一些优势,比如我有很多建立团队的经验,我的声誉也不错,能获得很多算力,并且我们很早之前就开始做了。
一些普通的创业公司可能不具备这些。
但我觉得在几年后,随着人们学会如何建设研究团队,随着算力的压力越来越小,随着人们越来越懂得如何打造好的 AI 产品,我想我们将会看到很多这样的公司。我们可能是第一家这样做的公司,但也许在 5 年后这会是非常常见的形态。

通用vs垂直

AGI时代MJ会成为什么?

张鹏
你担心 Midjourney 今天做的事情,有一天会被发展的 AGI 能力所覆盖吗?会发生什么?
像 Midjourney 这样的垂直产品的未来是什么?

David Holz
我不知道。这是个大谜团。
其中一种方式是,我们可能会与其他实验室合作,我们制作眼睛,他们制作耳朵,我们制作不同的部分,然后将它们组合起来。这种情况可能会发生。
我们创造想象力,他们制作语言部分,然后我们将它们组合在一起。所以我们将一起研究这个问题。
还有一种可能性,就是有这些几乎擅长所有事情的 AGI,但是也有这些部分是专业化的。世界上仍然有很多专业人士。
我也认为有可能有很多人机界面方面的问题,不仅仅是关于制作美丽的图片,而是关于帮助一个人探索他们是谁,以及他们想要什么。
这不是一个 AGI 的问题,而是更多地关于如何与人交互。
最好的用户界面,如果仅仅是语言,那么 AGI 可能会问我们问题。但实际上用户界面不仅仅是语言,它将向你展示许多图片,并试图以不同的方式了解人,这将是一种全新的艺术,全新的理解人的理论,AI 会试图帮助他们弄清楚他们想要什么。
我们还没有想到这些。AGI 可以做任何事情,但我也认为,像未来这样的大多数情况下,可能仍然有很多专业化。

社区的力量

一起探索 AI Copilot

张鹏
你认为 Midjourney 永远会是垂直产品,还是可以成为一些通用产品?
你已经说过你的使命是解决人类的意识想象力问题,不仅仅是关于图片。
David Holz
有一些很有趣的东西,我们正在做社区,如何让一群人一起探索一个很大的空间。
我们正在尝试创造这样的事情,在未来的一两年里,Midjourney 可能会成为世界上几乎所有视觉探索的地方,因此我认为有非常有趣的东西。
即使我们从未做过其他事情,如果我们只是世界上所有视觉探索的地方,我认为这是一项业务,但我认为我们无论做什么,视觉探索都将适用于其他领域。
试图创造这些数百万人的超级思维团队来共同解决问题非常有趣。我不认为任何一个 AGI 能够取代数百万人,但我认为可能会有 AI 参与,可能会有数百万人和数百万个 AI 一起工作,但我认为将有许多代理和许多参与方,我认为每个人的观点都有所不同,这有助于理解问题。

张鹏
许多我们称之为 AI 从业者的人,他们非常担心他们的产品被新的技术所替代。
你是否有同样的担心,担心 Midjourney 今天所做的事情有一天会被发展中的 AGI 能力所替代?
Midjourney 这样的垂类产品的未来可能是怎样的?

David Holz
找到有价值的东西或值得解决的问题,保持专注,同时保持开放的心态是解决这个问题的一方面。
另一方面,创造出来的 AGI 技术或者产品,他们仍然会和我们共同生存在同一个社会里,我们可以用 AI 去不断地创造新的东西,我们可以去定义在这个社会里 AI 要如何和我们协作去创造。
这就是我们正在做的事情,让大家一起去探索和共创
现在用视觉方式,在某些方面,它非常原始,但在其他方面,它可能是测试的最佳方式,因为你可以看到一切。
你可以真正看到它。而如果我们用诗歌来做这件事,我认为它会同样有趣,但有点难以理解。或者如果我们用引擎或任何其他科学来做这件事,你无法成为科学家,我们找不到 100 万个科学家,但是有 100 万人制作图片很容易找到。
因此,这里更多要考虑 AI + 人类整个社会的心智应该是什么样子的问题。现在大多数情况是人类使用 AI 去创造,但我认为在未来,AI 是可以和人共同去思考与创造的,那将会非常的有趣。也许到了某个时候,我们甚至都无法察觉到,一个想法到底是来自于人类,还是来自于 AI 了。

好胜心太强

是人性的弱点

张鹏
当然,近来对于 AI 安全和各个层面的竞争存在着很多关注和担忧。与此同时,继续扩大和改进当前大模型仍然存在挑战。你是如何看待 AI 领域的未来发展?
你会如何平衡不同的观点,甚至是不同政府的利益?
David Holz
首先,我觉得人性的一个弱点可能就是好胜心太强。
实际情况是这世上有很多机遇和挑战,甚至可以说有多少问题和挑战就会有多少机遇。我们面对着这么多机会,有时甚至都不需要我们去竞争获得。
所以,对我来说,我不会去考虑和谁竞争的问题,这世界上有很多事情需要去做,我只会尽可能地去创造我认为美好和让人惊叹的东西。
当我在中国的时候,我发现每个人总是很团结地在协作,从某种角度去看,这种方式和人工智能的原理有些类似。
因为它也是一种很社区化的东西,它从我们这里学习,然后它会把从我们这里学到的能力再反馈给我们。这是一种非常社区化和强调协作的方式。
我认为竞争有时并不是件好事,有时甚至说「想成为某个方向上最优秀的人」,也在某种程度上违背了技术本身的本质。
此外,我们也可以从东方文化中学习很多东西。我所在的地方,人们会担心技术和 AI 是否足够让人感到信任。但另一方面,大家又希望这个世界能够更加智能一些,这样就可以帮助我们去创造和解决更多的问题。
我发现在中国的时候,大家会因为你做的创造性的极客事情而认为你很酷,并且因为也想像你一样变得很酷。
现在大家都知道 AI 的能力有多强大了,我们就可以去共同努力,为每个人提供基础设施能力,去建设我们的生活环境。

10年后

一个神奇的未来

张鹏
最后一个问题,如果我们展望未来10年的数字世界,你认为今天人类世界中哪些事情不可避免地会发生变化?

David Holz
我认为十年后一个人的创造力可能比当下一群人的都更强大,所以当他们汇聚在一起时,将能做出我们现在无法去想象的事情。
这些力量将创造一个美好的世界。
大家对未来美好的想象将在某种程度上将每个人紧密地联系在一起,让我们不再害怕未来,而是对未来的到来感到更加兴奋。
一个神奇的未来肯定会在前面等待着我们,(我希望)它充满了美好,所以我们带着这样的想法才是最终实现那个美好世界的最佳方式。当然也有一些事情是我不能完全理解和想到的,但(对于10年后的未来)我认为应该就是这样的感觉。

张鹏
我赞同你的想法。
未来确实还有很多美好的事情在等着我们让它们发生,同时,我们在往前走时,也要去考虑如何去阻止那些不好的事情发生。今天和你的聊天很有收获,非常感谢你的分享!




如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。



更多阅读
历史第一黄仁勋:创业30年,万亿美金,他还是CEO
闭门交流纪要:大模型在机器人领域的应用探讨
英伟达创业故事:在廉价早餐店里,想象一个空白的市场
ChatGPT要起飞了!OpenAI刚刚招了一个世界级产品经理
黄仁勋发布全新最强GPU,专为大模型打造,微软谷歌Meta排队预定
微软个人助理来了!Copilot是最好的AI产品形态,插件将成为新的平台模式
微软CEO纳德拉访谈:OpenAI合作,谷歌搜索竞争,世界需要10亿开发者

转载原创文章请添加微信:geekparker
Founder Park 正在招募新的 AGI 观察者

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存