当前位置:首页|资讯|谷歌|OpenAI|人工智能

谷歌 Gemini 1.5 Pro :OpenAI Sora生成视频虽美但存逻辑瑕疵

作者:网界发布时间:2024-02-23

原标题:谷歌 Gemini 1.5 Pro :OpenAI Sora生成视频虽美但存逻辑瑕疵

近日,科技巨头谷歌与OpenAI在人工智能领域的竞争再掀波澜。谷歌的人工智能模型Gemini 1.5对OpenAI新推出的文本转视频工具Sora生成的一段视频进行了深入评价,指出视频在视觉效果上引人入胜,但存在多处不合逻辑之处,揭示出其非真实性。

此前,两家公司分别发布了各自的最新技术成果:谷歌推出了Gemini 1.5 Pro,而OpenAI则发布了备受瞩目的Sora。Sora的发布时间引发了外界的猜测,有人认为OpenAI此举旨在转移公众对谷歌Gemini 1.5的关注度。

谷歌一位高管在社交媒体平台上详细分享了Gemini 1.5 Pro对Sora生成视频的分析结果。以一段日本街道视频为例,视频中既有大雪纷飞的场景,又有樱花盛开的画面。然而,Gemini 1.5 Pro指出,这种景象在现实中是不可能出现的,因为樱花通常在春季绽放,而那时并不会有降雪。此外,视频中的雪花下落方式过于均匀,与真实降雪场景存在明显差异。同时,视频中的人物在大雪中却未穿着任何冬装,这也与实际情况相悖。

Gemini 1.5在分析中总结道:“虽然这段视频在视觉上具有很强的吸引力,但其中的逻辑矛盾表明它并非来自现实生活。”

Sora作为一款能够生成长达60秒视频的文本转视频工具,具备创建细节丰富场景、复杂摄像机运动以及多个人物画面的能力。这一突破性技术的出现被许多人誉为视频生成领域的“ChatGPT时刻”。

与此同时,谷歌的Gemini 1.5也展现出了强大的实力。它拥有惊人的100万词条上下文窗口,远超其他竞争对手如GPT-4 Turbo和Anthropic Claude 2.1。这意味着Gemini 1.5能够一次性处理大量信息,包括长达1小时的视频、11小时的音频以及超过30000行代码或70万字的代码库。这一特性使其在信息处理能力上达到了新的高度。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1