字节跳动正式进军AI视频生成式大模型领域,其旗下火山引擎在深圳举办的AI创新巡展上发布了豆包视频生成式大模型PixelDance和Seaweed,面向企业市场启动邀测。这两款模型在语义理解、多主体复杂交互及多镜头切换一致性上展现出业界先进水平,现场展示效果令人瞩目。火山引擎总裁谭待强调,豆包模型将持续进化,拓展AI视频的创作与应用边界。
豆包视频生成式模型突破了传统模型局限,能实现自然连贯的多拍动作与复杂主体交互,且在不同运镜下保持人物细节一致,接近实拍效果。基于DiT架构和高效的融合计算单元,模型支持变焦、环绕等多镜头语言,解决了镜头切换时的一致性难题。经过业务场景打磨,豆包模型还具备专业级光影布局和色彩调和,支持多种风格和适配多种设备比例,广泛应用于电商、教育、文旅等领域。
此外,火山引擎还推出了豆包音乐模型和同声传译模型,覆盖语言、语音、图像、视频全模态,满足各行业需求。豆包大模型的使用量迅速增长,日均tokens使用量超1.3万亿,多模态数据处理量庞大。其高性价比定价引领行业降价潮,并具备高并发流量支持能力,默认支持800K TPM,远超行业平均水平,灵活扩容以满足客户需求。谭待表示,大模型正从价格战转向性能和服务竞争,为企业创新提供强大支持。
(综合财中社内容)