7月27日,新壹科技发布首款聚焦视频的大模型“新壹视频大模型”,以及AIGC视频生成平台“秒创视频创作平台”,首款基于商用的数字人平台“新壹数字人平台”,此外,还发布了首款明星数字人祝福视频制作产品“秒祝”。
新壹科技表示,目前其AI生成能力已覆盖文本、图像、音视频等内容模态,实现了从大模型到平台服务再到产品服务落地的AIGC业务全链路打通。
新壹科技创始人、董事长韩坤表示,由于没有从实际场景出发,导致大部分通用大模型的实用性并不强,难以真正重塑实际的生产。“我们需要建立一个连接AI技术能力和垂直场景需求的大模型,能够提供释放生产力的能力,并创造更多实际价值的垂直场景大模型。”
据介绍,新壹视频大模型是以视频生成为核心的多模态AIGC模型。基于深度学习海量视频样本,新壹视频大模型拥有了从脚本生成、素材匹配、智能剪辑配音到数字人播报的AI全流程视频生产能力。
据介绍,新壹视频大模型具备多模态感知、实时学习、自迭代及多场景交叉推理的核心能力。能够处理多模态的输入信息,可以理解文字的含义,识别图像的内容,感知音乐的情绪,基于对内容深度准确的理解,生成视频。
新壹视频大模型采用了自监督学习方案,会观察和学习大量的视频数据,通过分析视频的结构、内容、风格等多个维度,自我理解和把握视频制作的规则和逻辑。
同时,新壹科技还现场演示了秒创视频创作平台的操作全过程。秒创是基于新壹科技视频大模型的智能AI内容生成平台。通过秒创平台,创作者可以把一篇文章甚至是一个想法制作为视频,5分钟即可从文案到视频成品。为了达到这样的效果,秒创除了提供图片生成、视频生成、声音生成、数字人生成等AIGC功能外,还提供了一个千万级的结构化视频库位用户提供匹配。据悉,秒创试运营半年多以来,已经积累了200多万的用户,每天产出超过10万分钟视频。
新壹科技还发布了数字人平台。通过多模态合成AI技术,该平台可以将真人录制的视频和音频素材,生成2D写实数字人。基于新壹视频大模型, 24小时内可完成一个数字人的训练。新壹数字人平台也可以驱动各种风格的3D数字人形象。新壹科技预计今年中国将至少新增100万个数字人。
秒祝通过对明星视频进行训练,将明星的形象和声音还原出来,生成对应的明星数字人形象。最终呈现给客户的是以明星数字人为主角的个性化定制祝福视频。
韩坤表示,在过去将近20年的时间里,新壹科技都在深耕视频行业,接下来,将推出更多的垂直场景服务平台和产品,比如为政府政务、金融保险、适老养老、智能交互数字人以及游戏等垂直场景提供服务,目前已经有解决方案和产品正在落地。