在AI领域的持续创新中,3D建模一直是等待着自己的"ChatGPT"时刻。
传统3D建模涉及游戏、影视、建筑等多个行业,其制作流程繁琐,生产周期长,成本高昂。每个3D模型的创建成本至少需要数千元,而生成式AI技术在2D图像生成方面的成功为其在3D建模中的应用带来了新的可能性。
2021年,OpenAI发布了DALL·E,通过输入文字prompt生成清晰的图像,标志着文字生成图片技术的成熟。这个项目成功地将AI应用于2D图像生成,为AI在3D建模领域的应用提供了启示。
2023年初,通用3D大模型公司「VAST」正式成立,算法团队成员全部来自海内外的顶尖高校和技术大厂,具有丰富的人工智能及图形学经验。VAST团队的目标是减少制作高质量3D资产和环境所需的专业知识和成本,使3D内容生成变得更加容易。
3D大模型生成的内容
通过集结来自全球顶级高校和技术大厂的团队,VAST在技术和数据方面取得了双重优势,尤其是3D大模型的算法方面。此外,他们拥有千万级别的3D原生数据库,为AI模型提供了丰富的学习资源。
与过去3D生成的技术路线不同的是,VAST团队认为通过统一表示、模型和数据,以及借鉴其他模态的成功经验,可以有效地解决当前3D内容生成面临的挑战,实现通用且可扩展的解决方案。这对算法、数据量、服务器等有很高的要求一一不过这恰恰也是VAST团队的核心优势。
VAST这一思路提高了生成模型的成功率和效率。目前,已经实现8秒钟生成带纹理3D网格模型,可以进入传统管线进行二次编辑和调整。在此基础上,可以再用5分钟的时间进行优化,优化后的3D模型可以接近人类手工制作的3D模型质量,成功率超过95%。
3D大模型生成的内容
在3D内容的生成上,AI同样面临着诸多挑战。传统流程中,3D数字内容的生成由积累长时间学习和工作经验的专业艺术家进行创作,且不同艺术家的工作流程不同,缺乏统一标准。对于现有的生成式大模型来说,3D数字内容是一种全新的语言体系,使得AI学习生成高质量3D模型变得复杂。
宋亚宸认为,要实现AI在3D生成领域的长足发展,需要跳出对人类知识的依赖,通过更庞大的数据和更多的计算,学习一种通用方法。
经过近一年的探索,VAST在2023年12月上线通用3D大模型Tripo。Tripo基于海量3D高质量原生数据库训练,是一个数十亿参数级别的3D大模型。与传统的3D建模相比,Tripo在生成的质量、速度、成功率上取得了领先地位。
3D大模型生成的内容
Tripo的成功主要得益于VAST在"通用3D大模型"路线上的技术探索。通过Tripo,VAST展示了强大的泛化能力,不论是写实还是风格化任务,亦或是结构复杂的幻想生物,都能在短时间内完成,为3D创意内容的未来发展描绘了巨大的潜力。
现阶段,用户使用Tripo生成的3D模型资产可以直接应用于影视、游戏、设计等多个领域,且单个模型的生成时间可以控制在几秒时间——相较于传统渲染引擎的数十分钟甚至几个小时,Tripo的效率提升了几个量级。
长期来看,VAST对于3D大模型的发展前景充满信心。宋亚宸表示,未来团队会持续优化大模型,并基于数据和技术积累,推出AIGC游戏和生成式AI多人竞技产品。“做好大模型,不断验证内容范式,一定会迎来平台型机会。”