Shape-E 教程：如何利用 Shap-E 模型文本到3D和图像到3D生成

作者：科技前沿AI发布时间：2023-05-29

Shap-E是OpenAI开发的一种创新模型，它可以使用文本或图像作为输入来生成一系列3D对象，从而改变了3D应用领域。这项非凡的技术可以在GitHub上免费访问，用户可以在自己的计算机上无缝运行它，不需要OpenAI API密钥或互联网连接。Shap-E的多功能性也是其与众不同之处，用户可以将生成的3D对象在Microsoft Paint 3D等软件中打开，甚至可以转换成STL文件进行3D打印。这项技术正在重新定义我们处理文本到3D和图像到3D生成的方式，以及人工智能应用程序可以从中产生哪些创造性的可能性。

在本教程中，我们将学习如何在Google Colab中创建笔记本，设置和使用OpenAI的Shap-E模型生成3D模型，并使用Blender Studio对其进行自定义。

首先，您需要前往blender.org并下载与您的操作系统兼容的Blender Studio。

接下来，转到Google Colab并创建一个新的笔记本。

在 Google Colab 中创建新笔记本

现在，我们需要将 Shap-E 存储库克隆到我们的 Google Colab Notebook。

!git clone https://github.com/openai/shap-e

进入目录并安装要求。

%cd shap-e!pip install -e .

添加新的code cell.

在这里，我们将导入所有必要的库。

import torchfrom shap_e.diffusion.sample import sample_latentsfrom shap_e.diffusion.gaussian_diffusion import diffusion_from_configfrom shap_e.models.download import load_model, load_configfrom shap_e.util.notebooks import create_pan_cameras, decode_latent_images, gif_widget

请点击“Run”按钮或按下“CMD/CTRL + Enter”键来运行单个代码块。

现在，我们将设置设备为CUDA（如果可用），否则设置为CPU。

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

单击Run或CMD/CTRL + Enter。

添加新的code cell.

在这里，我们将加载模型和权重。

xm = load_model('transmitter', device=device) model = load_model('text300M', device=device) diffusion = diffusion_from_config(load_config('diffusion'))

请点击“Run”或按下“CMD/CTRL + Enter”键。

请耐心等待，加载模型和权重需要一些时间。对我来说，这大约花费了5分钟的时间。但是，这取决于您的互联网连接速度。

接下来，我们将生成一个3D模型。

batch_size = 1 # this is the size of the models, higher values take longer to generate.guidance_scale = 15.0 # this is the scale of the guidance, higher values make the model look more like the prompt.prompt = "a donut" # this is the prompt, you can change this to anything you want.latents = sample_latents(
    batch_size=batch_size,
    model=model,
    diffusion=diffusion,
    guidance_scale=guidance_scale,
    model_kwargs=dict(texts=[prompt] * batch_size),
    progress=True,
    clip_denoised=True,
    use_fp16=True,
    use_karras=True,
    karras_steps=64,
    sigma_min=1E-3,
    sigma_max=160,
    s_churn=0,)

单击Run或CMD/CTRL + Enter。

生成 3D 模型需要一些时间，根据您的batch_size更高batch_size将需要更长的时间来生成 3D 模型。对我来说，生成 3D 模型大约需要 22 秒batch_size=1。

添加新的code cell.

这里我们将渲染 3D 模型，使用render_mode = 'nerf' Neural Radiance Fields (NeRF)来渲染 3D 模型。您可以将其更改为使用样式传递函数 (STF)render_mode = 'stf'渲染模式渲染 3D 模型。

render_mode = 'nerf' # you can change this to 'stf'size = 64 # this is the size of the renders, higher values take longer to render.cameras = create_pan_cameras(size, device)for i, latent in enumerate(latents):
    images = decode_latent_images(xm, latent, cameras, rendering_mode=render_mode)
    display(gif_widget(images))

请点击“Run”或按下“CMD/CTRL + Enter”键。

你看到模型旋转了吗？很酷，是吗？

接下来，我们将把3D模型保存为.ply和.obj文件。

请注意：.obj文件将在稍后在Blender Studio中用于自定义。

# Example of saving the latents as meshes.from shap_e.util.notebooks import decode_latent_meshfor i, latent in enumerate(latents):
    t = decode_latent_mesh(xm, latent).tri_mesh()
    with open(f'example_mesh_{i}.ply', 'wb') as f: # this is three-dimensional geometric data of model.
        t.write_ply(f)
    with open(f'example_mesh_{i}.obj', 'w') as f: # we will use this file to customize in Blender Studio later.
        t.write_obj(f)

单击Run或CMD/CTRL + Enter。

将选项卡切换到Files并点击刷新。您将看到example_mesh_0.ply和example_mesh_0.obj文件。

谷歌 Colab 文件

将文件下载.obj到本地计算机。

打开 Blender Studio 并创建新项目。

搅拌机工作室

删除默认多维数据集。

删除默认立方体

点击File> Import> Wavefront (.obj)。选择.obj您从 Google Colab 下载的文件。

导入 .obj 文件

您应该会在中心看到 3D 模型。

3D模型

它本身看起来很牛，顺便说一句，Shap-E 做得很好。

您可以根据需要自定义 3D 模型。

出于演示目的，我简单地使用粉红色的彩色浇头和棕色的甜甜圈。

定制3D模型

Midjourney 的 AI 生成艺术

在这个教程中，我们学习了如何使用Google Colab来设置和使用Shape-E模型。此外，我们还研究了Blender Studio并尝试了自定义生成的3D模型。

近期资讯

南卫股份获得实用新型专利授权：“一种高效真空包装机”
证券之星消息，根据天眼查APP数据显示南卫股份（603880）新获得一项实用新型专利授权，专利名为“一种高效真空包装机”，专利申请号为CN202421145048.7，授权日为2024年12月31日。
证券之星 2024-12-31

如何高效创建和管理微信群聊的实用指南与技巧分享
录”、“发现”和“我”。我们要点击“聊天”图标，进入聊天列表。在聊天列表的右上角，有一个“+”号，点击它后，会弹出一个菜单。在这个菜单里，你会看到“发起群聊”的选项，点一下这个选项。接下来，微信会显示你的好友列表。你可以在这里选择你想要邀请进群的人。可以通过滑动屏幕来查看更多的好友，或者直接在搜索框中输入好友的名字，快速找到他们。
新报观察 2024-12-31

掌握照片修饰技巧，提升摄影作品质量与视觉效果的艺术之旅
无论你是业余摄影爱好者，还是专业的摄影师，学会如何修饰照片都是提升作品质量的重要一步。在锐化时，要注意控制力度，过度锐化会造成画面出现噪点，反而影响美观。
新报观察 2024-12-31

如何选择适合自己的键盘：关键因素与实用建议解析
选键盘可不是一件简单的事，尤其是在如今这个各种品牌、各种类型的键盘层出不穷的时代。无论你是游戏玩家、程序员还是普通的上班族，找到一款适合自己的键盘都能提高你的工作和娱乐体验。接下来，就跟我一起聊聊选键盘的时候需要考虑的几个方面吧。首先，键盘的类型是个非常重要的因素。市面上主要有机械键盘、薄膜键盘以及静电容键盘。
新报观察 2024-12-31

华帝股份获得实用新型专利授权：“一种电热水器的挂架”
证券之星消息，根据天眼查APP数据显示华帝股份（002035）新获得一项实用新型专利授权，专利名为“一种电热水器的挂架”，专利申请号为CN202323498257.8，授权日为2024年12月31日。
证券之星 2024-12-31

如何高效管理邮箱：使用技巧与安全建议的全面指南
在这个数字化时代，邮箱已经成为我们生活中不可或缺的一部分。无论是工作、学习还是日常交流，邮箱都发挥着重要的作用。今天，我们就来聊聊怎么正确地使用邮箱，帮助你更好地管理和利用这个工具。首先，选择一个合适的邮箱服务提供商很重要。市面上有很多邮箱服务，比如Gmail、Outlook、Yahoo等，每个都有自己的特点和功能。
新报观察 2024-12-31

上纬新材获得实用新型专利授权：“试样对中装置”
证券之星消息，根据天眼查APP数据显示上纬新材（688585）新获得一项实用新型专利授权，专利名为“试样对中装置”，专利申请号为CN202420441555.9，授权日为2024年12月31日。
证券之星 2024-12-31

瑞纳智能获得外观设计专利授权：“控制网关”
证券之星消息，根据天眼查APP数据显示瑞纳智能（301129）新获得一项外观设计专利授权，专利名为“控制网关”，专利申请号为CN202430362219.0，授权日为2024年12月31日。2.本外观设计产品的用途：与云平台形成云边架构，内置AI调度算法，用于小区、换热站设备集控，实现智慧供热。
证券之星 2024-12-31

佰维存储获得发明专利授权：“封装结构散热优化方法、装置、可读存储介质及电子设备”
证券之星消息，根据天眼查APP数据显示佰维存储（688525）新获得一项发明专利授权，专利名为“封装结构散热优化方法、装置、可读存储介质及电子设备”，专利申请号为CN202110337921.7，授权日为2024年12月31日。
证券之星 2024-12-31

如何顺利安装和配置CAD软件，提升设计效率与技能
在现代设计和工程领域，CAD（计算机辅助设计）软件是不可或缺的工具。这里列出几个，供你参考：安装失败：如果安装过程中出现错误，检查一下系统要求是否满足，或者尝试以管理员身份运行安装程序。
新报观察 2024-12-31

Shape-E 教程：如何利用 Shap-E 模型文本到3D和图像到3D生成

推荐体验

相关资讯

Shape-E 教程：如何设置和使用 Shap-E 模型

OpenAI开源3D模型生成器Shap-E

OpenAI 推出 Shap-E 大模型，文本提示即可生成 3D 建模

AI生成生成3D Shap-e 使用指南

OpenAI研发全新从文本生成3D模型的系统Shap-E，大大提升速度

近期资讯

南卫股份获得实用新型专利授权：“一种高效真空包装机”

如何高效创建和管理微信群聊的实用指南与技巧分享

掌握照片修饰技巧，提升摄影作品质量与视觉效果的艺术之旅

如何选择适合自己的键盘：关键因素与实用建议解析

华帝股份获得实用新型专利授权：“一种电热水器的挂架”

如何高效管理邮箱：使用技巧与安全建议的全面指南

上纬新材获得实用新型专利授权：“试样对中装置”

瑞纳智能获得外观设计专利授权：“控制网关”

佰维存储获得发明专利授权：“封装结构散热优化方法、装置、可读存储介质及电子设备”

如何顺利安装和配置CAD软件，提升设计效率与技能

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响