每日元宇宙｜谷歌联合高校发布AI视频模型，苹果Vision Pro将发售

作者：元宇宙新声发布时间：2023-12-18

元宇宙谷歌苹果 OpenAI 微软

编辑｜孙浩南

今日导读

李飞飞谷歌联合发布AI视频扩散模型W.A.L.T

苹果Vision Pro即将发售，供应链：目前已做好年产100万台的准备

OpenAI宣布将在近期修复GPT-4问题，将在测试后更新模型

微软视频编辑工具Clipchamp推出新功能，包含AI自动创作、AI文本转语音

国脉文化：已内部开发基于大模型的AIGC数字内容生成平台

XR技能培训解决方案商Transfr宣布推出SDK，基于Unity提供低代码设计工具

李飞飞谷歌联合发布AI视频扩散模型W.A.L.T

12月12日消息，今日凌晨，李飞飞的斯坦福团队与谷歌联合发布用于生成逼真视频的扩散模型W.A.L.T，基于Transformer训练而成，支持文生视频、图生视频和3D摄像机运动。据介绍，该方法有两个关键的设计，一是使用因果编码器，在统一的潜空间内联合压缩图像和视频，从而实现跨模态的训练和生成;二是为了提高记忆和训练效率，使用了为空间和时空联合生成建模量身定制的窗口注意力架构。最后，团队针对文本到视频的生成任务训练了由三个模型组成的级联，包括一个基本潜在视频扩散模型和两个视频超分辨率扩散模型，能够以每秒8帧的速度生成分辨率为512*896的视频。

苹果Vision Pro即将发售，供应链：目前已做好年产100万台的准备

据报道，从供应链获悉从供应链获悉，因为OLEDoS显示屏的产能瓶颈被中国内地公司突破并进入一供，目前供应链已经做好了年产100万台的准备。界面新闻此前独家报道，苹果Vision Pro在12月量产，中国内地供应链比例已经大幅提高到60%，其中领益智造和立讯精密供应价值量位居国产前列。在国产OLEDoS显示屏供应商进入一供之后，内地供应链比例也将进一步提高。近日，彭博社报道苹果Vision Pro 将在2024年1月正式在北美发售。

OpenAI宣布将在近期修复GPT-4问题，将在测试后更新模型

12月12日消息，OpenAI 近日表示，将会在近期针对模型“变懒”的问题进行修复，不过需要等到完成线上测试和离线评估之后才可以更新。OpenAI 表示，他们将在彻底的离线评估和线上 A / B 测试后尽快更新 GPT-4 模型，同时也鼓励用户积极对模型表现进行回馈。此前曾有用户表示，ChatGPT出现变懒的问题，在用户提问之后，机器人并不会回答完整的问题，而只是给出部分回答，之后再引导用户自己写出剩余的答案。

微软视频编辑工具Clipchamp推出新功能，包含AI自动创作、AI文本转语音

12 月 12 日消息，微软视频编辑工具 Clipchamp 近日推出了一些新功能，包括 AI 视频自动创作。此外，个人账户用户现在还可以使用基于 AI 的文本转语音功能进行配音，用户也可以在应用程序中更改 AI 语音的语言、声音、情感和音调。此功能将于 2024 年初添加 Microsoft 商业账户中。

国脉文化：已内部开发基于大模型的AIGC数字内容生成平台

12 月 12 日消息，国脉文化表示，公司在文生视频方面，已内部开发基于大模型的 AIGC 数字内容生成平台，平台利用多模态技术，使用自有的版权内容，生成文字、音频、图片、视频等影视素材，进行内容的创作生产，正在内部试用中。

XR技能培训解决方案商Transfr宣布推出SDK，基于Unity提供低代码设计工具

近日，XR技能培训解决方案商Transfr宣布为其XR培训平台推出Transfr SDK，为3D设计师提供一套基于Unity的低代码高级设计工具，用于创建交互式XR培训模拟。该SDK最初以封闭测试版的形式提供给选定的合作伙伴，为其模拟产品提供了一致的体验。它为在Transfr平台上开发内容提供了更简便的方法，目前全美1000多个地点的数万名学生都可以访问该平台。