编辑|孙浩南
今日导读
李飞飞谷歌联合发布AI视频扩散模型W.A.L.T
12月12日消息,今日凌晨,李飞飞的斯坦福团队与谷歌联合发布用于生成逼真视频的扩散模型W.A.L.T,基于Transformer训练而成,支持文生视频、图生视频和3D摄像机运动。据介绍,该方法有两个关键的设计,一是使用因果编码器,在统一的潜空间内联合压缩图像和视频,从而实现跨模态的训练和生成;二是为了提高记忆和训练效率,使用了为空间和时空联合生成建模量身定制的窗口注意力架构。最后,团队针对文本到视频的生成任务训练了由三个模型组成的级联,包括一个基本潜在视频扩散模型和两个视频超分辨率扩散模型,能够以每秒8帧的速度生成分辨率为512*896的视频。
苹果Vision Pro即将发售,供应链:目前已做好年产100万台的准备
据报道,从供应链获悉从供应链获悉,因为OLEDoS显示屏的产能瓶颈被中国内地公司突破并进入一供,目前供应链已经做好了年产100万台的准备。界面新闻此前独家报道,苹果Vision Pro在12月量产,中国内地供应链比例已经大幅提高到60%,其中领益智造和立讯精密供应价值量位居国产前列。在国产OLEDoS显示屏供应商进入一供之后,内地供应链比例也将进一步提高。近日,彭博社报道苹果Vision Pro 将在2024年1月正式在北美发售。
OpenAI宣布将在近期修复GPT-4问题,将在测试后更新模型
12月12日消息,OpenAI 近日表示,将会在近期针对模型“变懒”的问题进行修复,不过需要等到完成线上测试和离线评估之后才可以更新。OpenAI 表示,他们将在彻底的离线评估和线上 A / B 测试后尽快更新 GPT-4 模型,同时也鼓励用户积极对模型表现进行回馈。此前曾有用户表示,ChatGPT出现变懒的问题,在用户提问之后,机器人并不会回答完整的问题,而只是给出部分回答,之后再引导用户自己写出剩余的答案。
微软视频编辑工具Clipchamp推出新功能,包含AI自动创作、AI文本转语音
12 月 12 日消息,微软视频编辑工具 Clipchamp 近日推出了一些新功能,包括 AI 视频自动创作。此外,个人账户用户现在还可以使用基于 AI 的文本转语音功能进行配音,用户也可以在应用程序中更改 AI 语音的语言、声音、情感和音调。此功能将于 2024 年初添加 Microsoft 商业账户中。
国脉文化:已内部开发基于大模型的AIGC数字内容生成平台
12 月 12 日消息,国脉文化表示,公司在文生视频方面,已内部开发基于大模型的 AIGC 数字内容生成平台,平台利用多模态技术,使用自有的版权内容,生成文字、音频、图片、视频等影视素材,进行内容的创作生产,正在内部试用中。
XR技能培训解决方案商Transfr宣布推出SDK,基于Unity提供低代码设计工具
近日,XR技能培训解决方案商Transfr宣布为其XR培训平台推出Transfr SDK,为3D设计师提供一套基于Unity的低代码高级设计工具,用于创建交互式XR培训模拟。该SDK最初以封闭测试版的形式提供给选定的合作伙伴,为其模拟产品提供了一致的体验。它为在Transfr平台上开发内容提供了更简便的方法,目前全美1000多个地点的数万名学生都可以访问该平台。
上海钢泽合金 2024-11-20
你好太空2022 2024-11-20
上海钢泽合金 2024-11-20