生数科技完成数亿元Pre-A轮融资，加速布局多模态大模型

作者：猎云网发布时间：2024-06-08

来源：猎云网。

近日，生数科技完成数亿元Pre-A轮融资，本轮融资由北京市人工智能产业投资基金、百度联合领投，中关村科学城公司等跟投，启明创投、卓源亚洲等数位老股东继续支持。

此前，生数科技已经获得来自蚂蚁集团、BV百度风投、卓源亚洲、锦秋基金、达泰资本、智谱AI等机构的投资。本轮融资完成后，生数科技将坚持其原生通用多模态技术路线，持续迭代优化自研大模型，并加速产品开发与市场拓展。

生数科技拥有深厚的技术底蕴，核心团队来自多个海内外顶级学术机构和科技企业，早在2021年就率先开始了扩散模型研究，是国内最早研究深度生成模型的团队之一。期间提出的免训练推断算法 Analytic-DPM、全球最快采样算法 DPM-Solver，被Stable Diffusion、DALL·E 2等图像模型采用，直接推动了全球图像生成浪潮的兴起。2022年提出全球首个Diffusion与Transformer融合架构U-ViT，短短半年后再次取得重大突破，开源全球首个基于此融合架构的多模态扩散模型 UniDiffuser，成功验证了大规模训练融合架构的可行性与涌现能力。

深厚的原创技术积累不仅为生数科技构建了全栈的自研能力，更为团队提供了前瞻的技术视角。2024年初，OpenAI推出视频大模型Sora，其背后采用的Diffusion 与Transformer融合架构和原生多模态技术路线引发关注，而彼时生数科技对该技术路线的布局已持续一年多。

早在2023年初大语言模型兴起之际，生数科技创始团队就研判大模型的发展必将从语言单一模态走向多模态融合。因此成立之初，生数科技就坚持采用U-ViT融合架构处理多模态数据，持续探索大模型在图像、3D、视频等多模态生成任务下的性能边界。

同年9月，生数科技发布产业级多模态通用大模型，在高质量图像生成、高精度3D模型生成、逐帧级视频元素编辑和个性化视频风格迁移等任务中达到行业顶尖水平。2024年4月，生数科技联合清华大学正式发布国内首个全自研视频大模型Vidu，性能全面对标OpenAI的Sora，在国内外引发广泛关注与高度认可。

在激烈的大模型竞争中，生数科技凭借超前的技术洞察和坚实的技术实力脱颖而出，成为国内首个布局原生多模态大模型路线并坚定持续投入的团队。同时在不断的探索和实践中，生数科技也在多模态数据管理平台和工程化方面构建了体系化经验，为模型的持续高效迭代提供了有力支撑。

此外在商业化进程上，生数科技从成立之初就致力于将前沿技术与商业化紧密结合，布局 MaaS（模型即服务）与应用级产品。截至目前，已陆续推出视觉创意设计平台PixWeaver、3D资产构建工具VoxCraft两款应用产品，同时携手多家合作伙伴，将多模态大模型应用于游戏、影视、文旅、智能终端等场景。

北京市人工智能产业投资基金表示：“多模态大模型是AI下一阶段发展的关键方向，市场潜力巨大，生数科技拥有领先的生成式AI研发团队，具备坚实的人才基础和深厚的技术积累。生数科技在图像、视频、3D等多模态领域所取得的一系列关键创新成果，在业内获得了广泛认可和高度评价，也充分证明了生数科技的技术实力和行业领先地位。我们对生数科技未来充满信心，并期待他们继续在大模型的浪潮中引领创新，开拓更广阔的发展前景。”

百度集团执行副总裁、百度智能云事业群总裁沈抖表示：“百度致力于构建一个更加多元、繁荣、可持续发展的大模型产业生态系统，生数科技将在其中发挥重要作用。未来，百度将发挥自身在智能算力、大模型平台、生态等方面的独特优势，帮助生数科技加速技术研究与创新，快速打通商业成功路径，共同做大产业‘蛋糕’。”

启明创投主管合伙人周志峰表示：“生数科技汇聚了一批生成式AI领域的资深专家和顶尖精英，凭借十多年的沉淀，已在多模态大模型的架构设计、训练策略、扩散模型的加速推断、多模态可控生成等关键技术领域，构建了全栈的自主研发能力。他们不仅拥有完备的技术实力、深刻的技术洞察和独到的技术布局，还积累了丰富的实践经验。公司凭借业界首创的Diffusion Transformer架构，当前已成为全球多模态大模型领域中最具竞争力的企业之一。启明创投作为生数科技上一轮的领投方，在本轮继续支持公司，我们坚信，生数科技将是这波大模型技术浪潮中的佼佼者，期待他们开启一段更加辉煌的新篇章。”