当前位置:首页|资讯|谷歌|OpenAI

支持100万token「大世界模型」火了,一次能分析1小时视频内容

作者:格物时间发布时间:2024-02-19

这项研究为语言模型更好地理解物理世界铺平了道路。最近,谷歌发布的Gemini 1.5多模态模型和OpenAI的视频生成技术Sora引发了科技界的广泛讨论。Gemini 1.5以其处理百万级别上下文的能力受到赞誉,而Sora模型因能够理解物理运动中的世界而被誉为“世界模型”。尽管它们的技术成就令人瞩目,但仍有局限性,例如Sora模型在复现一些复杂场景,比如逆向跑步机上跑步的人时,就显得有些力不足。随着大模型技术的迅猛发展,我们也逐渐意识到了它们的局限性。例如,对于那些难以用语言描述的现实世界内容,...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1