当前位置：首页|资讯|Stable Diffusion

传统文生 3D 的优化算法

作者：看看都市吧发布时间：2023-05-31

Stable Diffusion

传统文生 3D 的优化算法

给定一个 2D 图片上预训练好的扩散模型（例如 stable-diffusion），Dreamfusion [1] 提出可以在不借助任何 3D 数据的情况下实现开放域的文到 3D 内容（text-to-3D）生成。具体而言，对于一个 3D 物体，文生 3D 任务的关键是设计一种优化算法，使得 3D 物体在各个视角下投影出来的 2D 图片与预训练的 2D 扩散模型匹配，并不断优化 3D 物体。其中，SDS [1] （也称为 Score Jacobian Chaining (SJC) [3]）是目前几乎所有的零样本开放域文生 3D 工作所使用的算法。该算法将 3D 物体视为一个单点（single point），并通过随机梯度下降优化该 3D 物体，优化目标是最大化该渲染的 2D 图像在预训练扩散模型下的似然值。值得注意的是，该优化问题的最优解并不等价于从扩散模型中采样。

传统文生 3D 的优化算法示意图

实验中，所有基于 SDS/SJC 的方法目前都有一个严重的问题：生成的物体过于平滑、过饱和现象严重，并且多样性不高。例如，开源库 threestudio [4] 将目前主流的 text-to-3D 工作复现至与原论文可比水平，如下图所示：

由 threestuidio [4] 复现的文生 3D 工作

在此之前，基于 2D 扩散模型的文生 3D 仍然与实践落地有较大差距。然而，清华大学朱军团队提出的 ProlificDreamer 在算法层面解决了 SDS 的上述问题，能够生成非常逼真的 3D 内容，极大地缩小了这一差距。

推荐体验

相关资讯

华福证券：关注文生3D技术的进展

华福证券3月1日研报指出，OpenAI发布文生视频模型，随着模型的迭代升级，文生3D技术落地的可能性进一步增强。文生3D技术将极大降低美术资料生产环节的成本，提升“含美术量高”的开放世界类游戏的生产力。文生3D技术的落地在降低开放世界游戏制作成本的同时，也将推动越来越多该类别游戏的涌现。建议关注文生3D技术的进展以及在游戏行业的应用。

界面新闻 2024-03-01

Meta 推出文生 3D 模型「重磅炸弹」，一秒生成逼真 3D 素材

自从OpenAI发布Sora文生视频模型发布以来的这大半年中，专注于文生视频大模型的竞品们，如雨后春笋般不断涌现，让这个赛道竞争日益激烈。Meta公司官方发布研究论文，介绍了一个名为Meta3DGen的文生3D模型系统，能够在不到一分钟的时间内从文本生成较高质量的3D资产。

AppSo 2024-07-03

3d建模课程,3d建模好学?

能以自己姓氏命名的都有很强的自信，这个机构也不例外，创始人在二十年前就是CG行业的泰斗级人物，目前业内的CG公司里很多技术中流砥柱早年都是出自这里。AI绘画作为一种学习工具，可以帮助人们快速生成一些创意灵感和…

史培倩 2023-11-25

快速生成3D模型：Stability AI的Stable Fast 3D

和大家分享一下Stability AI（就是stable diffusion那家公司）最新发布的Stable Fast 3D（SF3D）的使用体验。这个工具可以在1秒内从一张图片生成3D模型，相比之前我试过的一些3D生成器，比如Meshy或者Rodin，还有清华大学的Unique3D（图片转3D）（AIGC 之三维模型生成，评测了几款图片转3D模型的AI工具），需要50-60秒甚至更长，快太多了。使用HuggingFace的Demo非常简单，免费无限✌。只需上传一张图片，调整前景对象的大小，然后点击“运

Stability AI Stable Diffusion Hugging Face

设计大爆炸 2024-08-07

图片合成3D视频！开源的3D渲染视频模型问世！

Stable Diffusion官方又又又又上新了。本次的下手对象是视频。3月18日，Stability AI发布了用于渲染3D视频的生成式AI视频工具Stable Video 3D（SV3D）。全新SVD的模型支持文本到视频、图像到视频生成。只需输入几行描述性的文字，或放入一段静态图像，你就能获得一段生动的动态视频。不光如此，它还支持物体从单一视角到多视角的转化。这意味着用户可以仅提供一个静态图像，SV3D就能够展示该对象从不同角度的样貌。并通过生成的多视角图像，进一步构建对象的3D网格模型，为用户提供

生成式AI Stable Diffusion Stability AI

AI-GitHub 2024-03-20

近期资讯

提升工作效率：Mac电脑窗口切换技巧与实用方法

在使用Mac电脑的过程中，切换窗口是一个非常常见的操作。无论你是在处理多个文档，还是在浏览网页，快速有效地切换窗口都能大大提高你的工作效率。只需继续按住键，然后按键，就可以在这些应用之间循环切换。

新报观察 2024-12-27

掌握长截图技巧，提升信息记录与分享效率！

这种长截图能够帮助我们捕捉到更多的信息，比如长网页、聊天记录、文章等，特别是在我们需要分享有价值的内容时，长截图就显得尤为重要。

新报观察 2024-12-27

山东特联信息科技取得一种气瓶阀门手轮专利，能够实现省力驱动

金融界2024年12月27日消息，国家知识产权局信息显示，山东特联信息科技有限公司取得一项名为“一种气瓶阀门手轮”的专利，授权公告号CN222209195U，申请日期为2024年5月。

金融界 2024-12-27

小米澎湃秒充协议免费开放；网易云音乐回应年度听歌报告不准；比亚迪秦PLUS EV/宋Pro限时优惠...

在2024小米「人车家全生态」合作伙伴大会上，小米澎湃秒充协议宣布面向所有车企、终端厂商、全行业配件厂商免费开放。根据现场放出的展品，安克、罗马仕等品牌的充电宝支持了小米澎湃秒充，分别支持33W和55W快充。该车已经在上个月开启预订，预计最终指导价为100-150万元。

IT之家 2024-12-27

国内首台自主研发磁悬浮离心式地源热泵机组在潍坊投运

IT之家12月27日消息，据天瑞重工官方消息，2024年11月16日，天瑞重工自主研发的国内首台磁悬浮离心式地源热泵机组，在山东省潍坊市某住宅小区成功开机运行。在相同工况下，原机组平均运行功率为156.9kW，磁悬浮离心式热泵机组平均运行功率为73.2kW，节电率达53.4%，同时噪音低至80dB以下。

IT之家 2024-12-27

任丘市满桥水暖器材有限公司取得新型排气阀专利，实现自动排气，提高灵敏性

金融界2024年12月27日消息，国家知识产权局信息显示，任丘市满桥水暖器材有限公司取得一项名为“一种新型排气阀”的专利，授权公告号CN222209192U，申请日期为2024年5月。

金融界 2024-12-27

荣耀 MagicOS 喜贺元旦相机水印上新

IT之家附适配机型如下：荣耀Magic7/6/5/4/3系列。荣耀MagicV3/Vs3/V2/Vs2/Vs/V系列。荣耀300/200/100/90/80/70/60/50系列。荣耀MagicVFlip、荣耀VPurse。荣耀X60/X50系列荣耀Play9T/Plav8T系列。

IT之家 2024-12-27

月球和深空探测“巨眼”上新 VLBI网究竟是个什么网？

今天（27日），西藏日喀则和吉林长白山两台40米口径射电望远镜落成启用，将有效提升我国月球和深空探测任务的测定轨能力，为射电天文研究提供更有力的观测平台。

北青网 2024-12-27

浙江沧海阀门科技股份有限公司取得防盗闸阀专利，解决闸阀因雨水腐蚀影响正常使用的问题

金融界2024年12月27日消息，国家知识产权局信息显示，浙江沧海阀门科技股份有限公司取得一项名为“一种防盗闸阀”的专利，授权公告号CN222209197U，申请日期为2024年6月。

金融界 2024-12-27

掌握无线蓝牙耳机使用技巧，轻松享受音乐与通话的乐趣

今天，我们就来聊聊无线蓝牙耳机的使用方法，帮助你更好地享受这项科技带来的便利。一般来说，耳机上会有一个电源按钮，长按这个按钮，耳机就会进入配对模式。配对成功后，耳机和手机就连接上了，以后只要打开耳机，它们就会自动连接，非常省事。

新报观察 2024-12-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1