深圳新闻网2024年3月14日讯(深圳特区报首席记者 李丽)视频生成大模型Sora以其优越性能受到全世界关注,却也几乎同时关闭了Sora的技术大门。日前,北京大学深圳研究生院-兔展智能AIGC联合实验室正式推出Open-Sora计划,旨在复现开源版的Sora。
兔展智能创始人、CEO董少灵表示,这一计划根植于北京大学和兔展智能长期以来的技术沉淀,双方希望通过开源的方式,带动全球范围感兴趣的技术人员参与进来,同时对外传播中国团队的技术自信,号召全球社区一起来做人类普惠的内容。
近期,Open-Sora计划在GitHub上一经公开,就被大量转发,该帖子浏览量破20万,国内外网友纷纷表示期待。目前,基于已经搭好的训练框架,能够支持动态输入、多尺度、多分辨率的训练,对于可变比例、可变时长的视频已经取得了较好的生成效果,初步完成第一阶段验证任务。据介绍,第二阶段将在有效框架基础上使用更多数据和更大算力,训练出20秒以上、720P清晰度的视频生成模型,实现该开源项目的目标;第三阶段作为延展目标,如果能得到更多支持,会考虑进一步延伸拓展生成的泛化性、场景多样性等,更加逼近Sora的时长和效果。
董少灵告诉记者,Open-Sora并不是为了做娱乐视频生成而提出的。更有价值的事情是将Open-Sora背后的底层模型,打造成深植于产业、赋能产业发展的中国本土的视觉大模型,让产业的供给与用户的需求更精准匹配。兔展智能经过多年深耕,依托庞大的用户量和数据飞轮,重度投入打磨“兔灵”大模型,希望通过“人工智能+”将以设计行业为代表的产业界过剩的产能,通过产品化设计更个性化的产品匹配需求,通过营销设计来激活需求,通过体验设计来连接需求,生成触达每一个终端个人的智慧屏内容,最终实现供给和需求更精准的匹配。
Open-Sora的诞生也离不开由兔展智能和北京大学共同探索的“TOP +TOP”科研与产业深度共赢的科创新范式。在学习吸纳美国先进研究机构科研创新机制的基础上,兔展智能联合北京大学深圳研究生院于2023年共同成立了AIGC联合实验室,提出了坚持“人类级使命”“奋斗者为本”“开放式创新”“真问题驱动”四大原则,共同探索产学研协同创新发展的新路径。未来,双方也将在推动视觉大模型更好赋能中国产业发展继续携手并进,为世界带来更多中国声音。