当前位置：首页|资讯

快手北大联手开源视频模型Pyramid-Flow ：可生成10秒超高清视频

作者：站长之家发布时间：2024-10-12

最近，快手和北京大学以及北京邮电大学的研究团队共同开源了一个名为 Pyramid-Flow 的超高清视频生成模型。

这个模型能够通过文本描述生成最高10秒、1280x768分辨率、24帧的视频，质量相当出色，光影效果、动作一致性、视频质量等方面表现都很不错。

Pyramid Flow 的工作原理与现有的视频扩散模型不同。现有模型通常在全分辨率下运行，这样做虽然能产生高质量的结果，但却消耗了大量计算资源。而 Pyramid Flow 则采用了流匹配的灵活性，可以在不同分辨率和噪声水平之间进行插值，这样就能更高效地生成和解压缩视频内容。

这一切都通过一个名为 DiT 的单一框架进行优化，大大缩短了训练时间。Pyramid-Flow 在 A100GPU 上仅经过了20，700小时的训练，能耗和效率远超市面上的同类模型。这对于那些没有庞大算力的中小企业和个人开发者来说，无疑是一个巨大的助力。

Pyramid-Flow 的创新之处在于它采用了一种名为金字塔流匹配的技术。这种方法将视频生成分解为多个不同分辨率的阶段，开始时生成低分辨率的草图，然后逐步提升到高分辨率。这样的设计既降低了计算负担，又提高了生成的灵活性。每个阶段都是从一个像素化的噪声表示演变而来，直到变得清晰。为了确保每个阶段之间的连续性，算法在过渡时会重新引入一些噪声。

此外，模型还利用自回归框架和块状因果注意力机制，使每一帧都能基于之前的帧进行生成，确保视频的连贯性和逻辑性。

在性能方面，Pyramid Flow 在各大比较平台上都表现优异。与市面上的一些商业模型相比，尽管它只使用了公共视频数据，但在质量和流畅度评分上都不遑多让。此外，通过用户调查发现，参与者普遍对 Pyramid Flow 的生成效果表示满意，尤其是在视频的运动平滑度方面，表现更加出色。

无论是想要生成精彩的视频内容的创作者，还是在探索新技术的研究者，Pyramid Flow 都为他们提供了一个高效、易用的选择。

推荐体验

相关资讯

这款视频生成人工智能工具，可生成超高清视频

OpenAI最新推出的Sora是一款视频生成人工智能模型，其工作方式类似DALL-E和OpenAI的图像生成工具。Sora还可以根据静态图像生成视频片段、扩充现有视频或填补缺失帧。

人工智能 OpenAI DALL·E

中关村在线 2024-02-16

宣战Sora！Runway最新视频生成模型上线，可生成10秒高保真、高动态视频

宣战Sora！Runway最新视频生成模型上线，可生成10秒高保真、高动态视频智东西2024-06-18 19:15发布于北京智东西官方账号智东西（公众号：zhidxcom）编译李水青编辑

智东西 2024-06-18

快手申请视频大模型可灵商标快手申请视频大模型商标

天眼查App显示，近期，快手关联公司北京达佳互联信息技术有限公司申请注册2枚“可灵”和2枚“快手可灵”商标，国际分类均为科学仪器、网站服务，其中2枚“可灵”商标状态为“等待实质审查”，而2枚“快手可灵”商标状态已变更为“初审公告”。不久前，快手视频生成大模型“可灵”已开放邀请测试。据介绍，可灵大模型为快手AI团队自研，效果对标Sora。

和讯网 2024-06-18

媲美Sora？快手文生视频模型可灵开放测试最长可生成2分钟视频

站长之家(ChinaZ.com)6月7日消息:昨天，快手公司推出了一款名为「可灵」的全新视频生成大模型，该模型采用了与Sora相似的技术路线，并结合了快手自研的多项技术创新。这款模型不仅能够生成长达2分钟、30fps、1080p分辨率的超长视频，支持多种宽高比，还能模拟物理世界的特性，精准建模复杂运动。

站长之家 2024-06-11

快手“可灵”大模型可生成最长约3分钟视频

6月21日消息，快手“可灵”视频生成大模型今日宣布推出图生视频功能，支持根据不同文本内容，将静态图像转化为生动的5s视频。同时，支持对已生成的视频一键续写和连续多次续写，单次可让视频延续约5秒，最长可生成约3分钟视频。此前，快手表示“可灵”将对标Sora，目前已有约14万人申请测试。

金融界 2024-06-21

近期资讯

两年内五战太空！马斯克的星舰今晚再试飞，有什么新变化？

两年内五战太空！马斯克的星舰今晚再试飞，有什么新变化？腾讯科技2024-10-13 15:20发布于北京腾讯新闻科技频道官方账号全文2116字，阅读约需7分钟，帮我划重点划重点01SpaceX计

腾讯科技 2024-10-13

Meta确认取消高端头显Quest Pro 2，超轻量头显在路上

Meta确认取消高端头显Quest Pro 2，超轻量头显在路上IT之家2024-10-13 15:31发布于山东IT之家官方账号IT之家 10 月 13 日消息，Meta 的首席技术官 Andr

IT之家 2024-10-13

芯联集成：预计前三季度营收 45.47 亿元，同比增长约 18.68%

芯联集成：预计前三季度营收 45.47 亿元，同比增长约 18.68%IT之家2024-10-13 17:46发布于山东IT之家官方账号IT之家 10 月 13 日消息，国内新能源半导体公司芯联集

IT之家 2024-10-13

李杰确认一加 13 手机采用京东方 X2 发光材料

李杰确认一加 13 手机采用京东方 X2 发光材料IT之家2024-10-13 17:26发布于山东IT之家官方账号IT之家 10 月 13 日消息，一加中国区总裁李杰今日发文称，一加 13 定制

IT之家 2024-10-13

合纵连横迎战双11，阿里京东对抗电商新势力

合纵连横迎战双11，阿里京东对抗电商新势力钛媒体APP2024-10-13 15:17发布于河北钛媒体APP官方账号全文2864字，阅读约需9分钟，帮我划重点划重点012024年的双11大战提前

钛媒体APP 2024-10-13

“筷子”夹火箭？围观超重型助推器回收全程：系统协调与手动指挥的挑战

腾讯科技 2024-10-13

消息称华为商用鸿蒙系统本月发布，11 月旗舰新品上市

消息称华为商用鸿蒙系统本月发布，11 月旗舰新品上市IT之家2024-10-13 19:01发布于山东IT之家官方账号IT之家 10 月 13 日消息，博主 @看山的叔叔于 10 月 11 日发

IT之家 2024-10-13

iQOO 13 手机支持无网通信功能，手机变身“对讲机”

iQOO 13 手机支持无网通信功能，手机变身“对讲机”IT之家2024-10-13 17:26发布于山东IT之家官方账号IT之家 10 月 13 日消息，iQOO 产品经理 @戈蓝V 今日爆料称

IT之家 2024-10-13

梦境交流成真：研究人员实现人类首次梦中“对话”

梦境交流成真：研究人员实现人类首次梦中“对话”IT之家2024-10-13 14:01发布于山东IT之家官方账号IT之家 10 月 13 日消息，据 InterestingEngineering

IT之家 2024-10-13

收到OlaFriend的12个小时：我对字节AI耳机的印象低开高走了！

收到OlaFriend的12个小时：我对字节AI耳机的印象低开高走了！科技公寓2024-10-13 15:24发布于北京科技领域创作者1. 低预期的初次相遇去年11月我买了Meta的Ray-Ban

科技公寓 2024-10-13

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1