当前位置：首页|资讯

Vidu全球首发“主体参照”功能视频生成进入新阶段

作者：北青网发布时间：2024-09-14

近日，由生数科技和清华大学联合研发的国内首个纯自研原创视频大模型 Vidu全球首发“主体参照”功能，该功能能够实现对任意主体的一致性生成，让视频生成更加稳定、可控。目前该功能面向全部注册用户免费开放。

Vidu支持图生和文生视频两种能力，于7月底正式上线。所谓“主体参照”，就是允许用户上传任意主体的一张图片，Vidu 就能够锁定该主体的形象，通过描述词任意切换场景，输出主体一致的视频。

该功能不局限于单一对象，而是面向“任意主体”，无论是人物、动物、商品，还是动漫角色、虚构主体，都能确保其在视频生成中的一致性和可控性，这是视频生成领域的一大创新。Vidu 也是全球首个支持该能力的视频大模型。比如进行人物角色的“主体参照”，无论是真实人物还是虚构角色，Vidu 都能保持其在不同环境中、不同镜头下的形象连贯一致。

例如，输入一张林黛玉的角色照，输入同样的“在现代咖啡厅喝咖啡”的描述，能直观看到，在Vidu “主体参照”功能下，林黛玉的形象在现代场景中得到了完美保留，场景输出也自然而真实。

据了解，此前的视频模型往往难以实现这一点，常常是主体在生成过程中容易崩坏。为了解决这一问题，业界曾尝试采用“先AI生图、再图生视频”的方法，通过AI绘图工具如 Midjourney 生成分镜头画面，先在图片层面保持主体一致，然后再将这些画面转化为视频片段并进行剪辑合成。不过，AI 绘图的一致性并不完美，更重要的是，实际的视频制作过程中涉及众多场景和镜头，导致生图的工作量巨大。而Vidu 的“主体参照”功能彻底改变了这一局面。它摒弃了传统的分镜头画面生成步骤，通过“上传主体图+输入场景描述词”的方式，直接生成视频素材。

Ainimate Lab AI 负责人陈刘芳表示，Vidu与北京电影节 AIGC 短片单元最佳影片得主、Ainimate Lab 合作打造的动画短片《一路向南》，创作团队仅由三人构成：一名导演、一名故事版艺术家和一名 AIGC 技术应用专家，制作周期约为 1 周，而传统流程需要 20 人，包含导演、美术、建模、灯光、渲染等不同“工种”，周期在一个月左右。画面质量接近传统动画制作标准，但成本仅为传统流程的 1/40。

文/北京青年报记者温婧

编辑/田野

推荐体验

相关资讯

AI大模型竞速进入新阶段

本报记者孙奇茹人工智能大模型早已掀起“百模大战”乃至“千模大战”。热潮之下，谁能率先落地、将技术变现，无疑成为大模型赛场上的关键赛点。在ISC 2023第十一届互联网安全大会期间，知名企业家、顶尖

AI大模型人工智能

北京日报 2023-08-11

大模型发展进入产业应用新阶段

自2022年底ChatGPT上线以来，不到一年时间里，人工智能大模型已经成为一条社会各界普遍认可的新赛道。随着越来越多玩家快速涌入，产业也开始逐渐摆脱炒概念的过热阶段，向实际应用落地的新阶段演进。

ChatGPT 人工智能

中国战略新兴产业 2023-09-11

让AI从尝鲜到常用，手机进入发展新阶段，OPPO诸多AI功能备受好评

功能机时代、智能机时代后，如今我们正在经历第三次手机行业的重大变革。无论你是普通消费者还是相关从业人士，肯定都注意到了今年各大手机厂商纷纷开始在手机上搭载AI大模型、打造AI应用，让不同功能的“AI手机”成为现实。最令人印象深刻的无疑是OPPO，龙年春晚前的一场“史上最短发布会”宣告了OPPO正式开启了AI手机时代，OPPO AI手机将让AI从尝鲜到常用。（OPPO AI手机让AI从尝鲜到常用）比如最新的OPPO Find X7系列不仅是首款端侧部署70亿参数大模型的手机，而且依托于自主训练的安第斯大模型

快乐小丑0 2024-03-07

文生视频时代国产AIGC公司开启新阶段

OpenAI年初掷出的炸弹——视频生成模型Sora，激起层层浪花，根据简单几句提示，Sora便能准确“理解”文本，生成长达60秒的视频，在保持高视觉质量的同时忠实再现用户指令，引发业内轰动。

AIGC OpenAI Sora

环球网产经 2024-03-18

申宇婧：人工智能治理进入新阶段，将成为全球治理的重要领域

无独有偶,6月8日发布的美英《大西洋宣言》提到,要建设美英数据桥,举办第一届人工智能安全全球峰会,联合盟友推出人工智能安全措施等,建立隐私保护技术的合作机制(PETs)等,这一“宣言”与G7如出一辙,再次表明…

人大重阳 2023-07-06

近期资讯

石油工业上游绿色转型发展形势与建议

[图片] 原文刊载于《中国科学院院刊》2024年第7期“专题：科技创新引领现代化产业体系建设” 窦立荣1,2 郜峰1* 彭云1 王曦1 熊靓1 1 中国石油勘探开发研究院 2 中国石油国际勘探开发有限公司当前，世界能源转型进程总体加速但不确定性进一步增强，全球油气行业呈现出业务结构从油气主导向多能互补转变，市场格局从“全球化”向“东西半球分化”转变，政策导向从激进转型向有序发展转变，技术创新从传统领域向新兴领域拓展等四大趋势。各国政府和国际石油公司都结合自身情况做出政策规划、战略目标、实施路径等调整。

中国科学院院刊 12小时前

N1未过，但上岸——对外经济贸易大学考研经验分享|24年考研经验|瑞译学苑

——tousei 1.个人简介我的本科是广东的一所普通大学，连双非都算不上的那种，但是日语专业的老师们实力还是非常强的。我个人成绩在日语系中算不上特别拔尖，课程成绩在全日语专业中大概在中上水平，如今仅持有专四证书和大学英语四六级以及高中日语教资，N1在2023年很遗憾没有通过，已经报名了今年7月的N1，希望这次听力可以给点力顺利通过。所以其实我日语水平比起瑞译的大佬们简直不足一提，当时也十分忐忑能否上岸。但其实回过头来看考研其实是一场机会与风险并存的游戏，连我都可以上岸，大家也要相信自己，我也始终坚

瑞译学苑-MTI及CATTI日语 12小时前

OS每日公告速递(2024.09.18)

[图片] 中国台湾地区正式版小米 11(venus)：OS1.0.3.0.UKBTWXM 小米平板 6(pipa)：OS1.0.7.0.UMZTWXM 国际正式版小米 12X(psyche)：OS1.0.5.0.TLDMIXM 小米 12T Pro(diting)：OS1.0.7.0.ULFMIXM 欧洲EEA正式版小米 11T Pro(vili)：OS1.0.5.0.UKDEUXM Redmi 13C 国际 / POCO C65(gale)：OS1.0.5.0.UGPEUXM 欧洲ThreeHK

海格Hege 12小时前

以进阶实力树立SUV市场新标杆全新瑞虎8 PLUS惊艳亮相石家庄国际车展

2024年9月14日至18日，为期五天的2024中国（石家庄）国际汽车工业展览会在石家庄国际会展中心（正定）盛大启幕。本次车展以“新活力新场景新出行”为主题，吸引了众多国内外知名汽车品牌参展。其中，奇瑞品牌携旗下全系车型亮相，并在8号馆成功举办了全新瑞虎8 PLUS的区域上市发布会，吸引了众多参展商、媒体和消费者的目光。全新瑞虎8 PLUS以进阶实力树立了SUV市场新标杆，成为车展上的焦点。 [图片] 全新瑞虎8 PLUS自9月10日全球上市以来，就备受瞩目。此次在石家庄国际车展的惊艳亮相，更是将其卓

庄里微 12小时前

16+512G大内存，骁龙7G3+直面屏+6000mAh，vivo也有良心机

在各大手机厂商里面，vivo算是比较折中的，它没有苹果、三星、华为的溢价，但也不像那些子品牌，去主打一个性价比，毕竟还有线下消费者，vivo的颜值手感方面，确实是有两把刷子，那么在它的产品线中，哪款手机值得考虑呢？个人觉得vivo S19，是一个很好的选择，参数配置足够过关，外观设计没有妥协，关键价格也挺便宜，2000元左右能买到。在核心的配置上，vivo S19还算合格，搭载了骁龙7Gen3，跑分成绩接近100万，日常使用是流畅的，毕竟“橘子”OS优化，算是第一档的系统，该机内存也不吝啬，顶配16+51

凌晨四点的飞行员 12小时前

乙方求职甲方大厂工作，一击即中的秘密！

你好，我叫佳佳，在税务师事务所做高级税务经理，给企业客户提供全方位的税务咨询、鉴证、规划等服务马上要35岁了，在乙方再干下去，发现弊端很多，比如：工作压力大，经常出差，熬夜加班，身体吃不消，还没有时间照顾孩子而且在事务所做合伙人，要营销拓客，也不是我职业发展的目标所以我下定决心，要进入甲方企业工作，否则年龄越大越出不来我有这个想法，就开始投简历，但投了一段时间，发现根本没有甲方企业找我面试搞的都自我怀疑了，我想到甲方企业工作，这条路到底能不能走通呢？既然我靠自己摸索，搞不定，那我想不如专业的事找专业的人办

金饭婉 12小时前

《易经》、《春秋》、《乐》、《诗》、《仪礼》是怎么写出来的？

经学与中国文化的关系很密切。经学虽然为封建统治阶级服务，但也起了一些好的作用。例如，宗教是无产阶级革命的顽固敌人，许多民族的宗教信仰很深，汉民族的情况就不同些。汉民族的宗教——道教和来自印度传入中国的佛教，在隋唐时期盛行，但无论如何总有儒家与他们对抗。唐太宗时，道教的地位最高，佛其次，儒排在最后。武则天时，佛的地位最高，道其次，儒仍旧排在最后。尽管儒的地位不及佛、道，做官的人很多都信佛、道，但唐代仍以经书取考取仕途，他们总觉得自己是儒者。以诗赋应试的进士，也很多以儒自命。宋学是由韩愈创始的，韩

心可光明 12小时前

office使用训练+练习完整版 pdf格式工作必备在线分享

简介： office使用训练+练习完整版 pdf格式工作必备在线分享 [图片] 复制链接到浏览器网盘下载链接：https://pan.quark.cn/s/8fc56b72069a 建议及时保存链接如果挂了，请留言补档！会及时补档！（如果帮到您的话希望点赞+关注+投币希望一键三连！感谢）注意手机/电脑端直接选中链接点击/右键单击链接即可访问下载资源！

lht05155 12小时前

大型纪录片之没有惊喜的苹果发布会

大型纪录片之没有惊喜的苹果发布会省流介绍：1 手机还是那样，样子还是那样小改，价格还是那样，也就是普通升级个芯片2 其他配件，老款也可以用，真的不值得冲新款3 自从苹果 X 系列固定全面屏，12 系统固定方方外形，基本上更新都乏善其尘第一章：常规升级的循环——苹果手机：从创新到不变的转变苹果手机，曾经是科技界的一颗璀璨明星，每一次新品发布都伴随着技术的革新与设计的颠覆。然而，随着时间的推移，苹果手机的更新似乎进入了一个“常规升级”的循环。消费者对“小改款”升级的态度变化就是没态度。第二章：配件的延续性——

小马识途店 12小时前

pdf转jpg怎么转？这7个转换工具，一定不要错过！

pdf怎么转换成jpg？pdf是一种通用的便携文件格式之一，而jpg是一种广泛使用的图像格式，平时处理这两种格式文件时，难免会遇到需要将pdf转成jpg格式的情况，例如在学术研究、创意设计、报告提交等领域。pdf转jpg是一个很常见的格式转换需求，如果你需要将pdf文件转换为jpg图片，通过本文介绍的七个方法，可以快速实现。（一）关于pdf转jpg的作用和优势与PDF相比，图片的加载速度更快、方便查看。帮助用户节省时间、大大提高效率。图片不需要打开文件，只需要点击就可以查看，可以从多页pdf中，直接截取查

金舟软件 12小时前

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1