一句话生成3D模型来了！动动嘴就完成建模不再是梦想！

Original 穿行者2049 今说新语 2024-04-14

本周，开源人工智能研究机构 OpenAI 发布了一项新技术Point-E，可以直接从文本生成 3D 模型。这一技术的出现，为计算机视觉领域带来了新的突破，也为人工智能在视觉领域的发展提供了更多可能性。

在过去的几十年里，计算机视觉技术一直是人工智能领域的重要研究方向。计算机视觉技术的发展，有助于人工智能在自动驾驶、图像识别、机器人等领域的应用。而随着深度学习技术的发展，计算机视觉技术也取得了长足的进步。

然而，在计算机视觉领域，从文本生成 3D 模型的技术一直是一个挑战。这一技术的难点在于，需要计算机能够理解文本中描述的物体的形状、尺寸、颜色等信息，并将这些信息转化为 3D 模型。这需要计算机具备自然语言理解、图像生成和 3D 建模等多项技术。

而 OpenAI 在最近发布的 3D 模型生成技术中，成功地解决了这一挑战。通过训练大量数据，让计算机能够理解文本中的物体信息，并将其转化为 3D 模型。在测试中，这一技术的生成速度提升了600倍，能够生成出精细的 3D 模型。

Point-E 不输出传统意义上的 3D 图像，它会生成点云，或空间中代表 3D 形状的离散数据点集。随后一个额外的人工智能系统来将 Point-E 的点云转换为网格。

Point-E 由两个步骤组成：文本到图像模型和图像到 3D 模型。文本到图像模型类似于 DALL-E 2 和 Stable Diffusion 等text2Img系统，在图像生成之后，再执行图像到 3D 模型生成。

程序目前已开源，并已经有了演示版可以体验。

文本生成3D

图像生成3D

文本生成图像再生成3D

点状云图

3D模型

可下载的模型文件

这一技术的出现，不仅为计算机视觉领域带来了新的突破，也为人工智能在视觉领域的发展提供了更多可能性。例如，在未来，这一技术可以用于自动生成 3D 建筑模型、游戏角色模型等，为计算机视觉领域的应用带来新的想象空间。

此外，这一技术的出现，也为人工智能在自然语言理解、图像生成和 3D 建模等领域的发展提供了新的思路。在未来，随着计算机视觉技术的不断发展，人工智能可能会在更多领域得到应用。

总的来说，OpenAI 发布的 3D 模型生成技术，为人工智能在视觉领域的发展带来了新的机会，也为计算机视觉领域的应用提供了新的想象空间。希望在未来，这一技术能够得到更多的发展，为人类带来更多的便利。

感兴趣的朋友可以去体验一下。

项目地址：https://github.com/openai/point-e

演示版地址：https://huggingface.co/spaces/anzorq/point-e_demo

根据你的喜好，推荐阅读以下AI绘画内容：

对写作者最好的支持就是

转发、点赞、关注、打赏

继续滑动看下一个

今说新语

向上滑动看下一个