曝OpenAI大模型新进展！将推出多模态大模型，新项目Gobi筹备中

作者：智东西发布时间：2023-09-19

曝OpenAI大模型新进展！将推出多模态大模型，新项目Gobi筹备中

智东西（公众号：zhidxcom）

编译 | 陈佳慧

编辑 | 徐珊

智东西9月19日消息，据The Information报道，OpenAI意图赶在谷歌推出多模态大语言模型Gemini前，发布其多模态大语言模型GPT-Vision。而后，OpenAI或许会推出一个更强大的多模态大模型，代号为Gobi。

今年3月OpenAI发布的GPT-4已经融入了部分多模态功能，相较于GPT-3.5只能接受文本输入，GPT-4还可以接受图像输入，但该视觉输入性能并不开放使用。而Gobi与GPT-4不同，Gobi从一开始就是按多模态模型构建的，可以接受更多类型的信息输入并做出相应的处理。

OpenAI与谷歌将多模态功能纳入大语言模型，可以将图像、文字、音频等不同形式的数据整合起来，让大语言模型更准确、更全面地处理用户所给信息，为用户提供便利。据The Information报道，OpenAI与谷歌的多模态大语言模型之争，就像AI领域的苹果与安卓之争。这或许预示着AI大模型领域未来的发展趋势，同时也是OpenAI与谷歌抢占这项新技术的首发先机，提高用户影响力和技术引领地位的重要竞赛。

一、Gobi VS Gemini，OpenAI与谷歌多模态大语言模型赛跑

此前有报道称，谷歌即将推出Gemini，并且已经向一小批外部公司分享了这个项目。但据知情人士透露，OpenAI正在争分夺秒地把公司最先进的GPT-4与多模态功能相结合，想要抢在谷歌之前发布Gobi。并且，OpenAI在今年3月发布GPT-4时，就对GPT-4中融入的多模态功能进行了预展示。不过，根据The Information报道，OpenAI还没有开始训练Gobi，因此现在还不知道Gobi最终能否成为GPT-5。

对于OpenAI能否在多模态大语言模型方面超越谷歌，据The Information报道，目前，谷歌拥有来自谷歌搜索引擎和YouTube等平台的文本、图像、音频、视频等专有数据，这是谷歌相较于OpenAI发展多模态大语言模型的一项特殊优势。并且一位使用过Gemini早期版本的人士说，与现有的各种大语言模型相比，Gemini产生的错误答案似乎更少。

▲OpenAI联合创始人Greg Brockman演示GPT-4中的多模态功能（来源：OpenAI官网）

二、多模态功能肩负重任，被滥用的信息安全问题值得重视

在3月发布GPT-4预览多模态功能时，除了为盲人或低视力者开发技术的Be My Eyes公司，OpenAI没有给其它公司提供多模态功能。到现在，OpenAI才准备在更大范围内推出被称为GPT-Vision的功能。据The Information报道，OpenAI可能会在GPT-Vision之后再推出Gobi。

根据The Information报道，OpenAI之所以耗费大量时间来推出Gobi，主要是担心新的视觉功能会被坏人利用，例如通过自动解决验证码来冒充人类，或者通过人脸识别追踪人们。但现在，OpenAI的工程师们似乎想到办法来缓解这个安全问题了。

谷歌的Gemini也面临同样的问题，当谷歌被问到采取了哪些措施防止Gemini被滥用时，谷歌的一位发言人称，谷歌在7月份做出过一系列承诺，以确保对其所有产品进行负责任的AI开发。

▲谷歌的新多模态大语言模型Gemini

结语：多模态大模型之争或成下个AIGC焦点

多模态功能正被不断融入大语言模型，以提高大语言模型分析的精准度。如今，因ChatGPT名声大噪的OpenAI与AI老牌公司谷歌都致力于开发多模态大语言模型，可见其或许将成为AI大模型发展的未来趋势。

据The Information报道，这场OpenAI与谷歌的竞赛类似于AI版的苹果与安卓之争，而未来Gobi与Gemini的到来，将揭示OpenAI和谷歌的竞赛结果。

多模态大模型作为当前AI大模型领域的最新进展，OpenAI与谷歌之间的多模态大模型之争不仅是科技竞争的焦点，也可能引发全球范围内关于技术应用、合作、监管和伦理等方面的重要讨论。

来源：The Information

曝OpenAI大模型新进展！将推出多模态大模型，新项目Gobi筹备中

曝OpenAI大模型新进展！将推出多模态大模型，新项目Gobi筹备中

推荐体验

相关资讯

曝OpenAI大模型新进展，将推出多模态大模型，新项目Gobi筹备中

GPT-5要来了？OpenAI被曝加急训练多模态大模型Gobi

「盘中宝」新进展，OpenAI推出更快、更智能人工智能模型，大模型、多模态等AI应用不断突破，这家企业已推出细分行业首款AI应用产品

OpenAI正开发新品多模态大模型Gobi，对标谷歌Gemini

油气大模型新进展：大模型和知识图谱的双向奔赴

近期资讯

掌握Word字数统计功能，提升写作效率与质量

掌握小程序制作技巧，提升生活与业务的数字化体验

掌握视频复制技巧，轻松实现多平台视频下载与管理

如何有效保存PPT文件：技巧与注意事项全解析

如何通过设置OPPO手机锁屏提升安全性与个性化体验

掌握MATCH函数：快速查找数据位置的实用技巧与应用

如何有效清理电脑内存，提升运行速度与使用体验的方法解析

如何在苹果手机上设置屏幕密码以保护个人隐私和数据安全

寄件技巧全解析：让寄送包裹更加顺畅与安全的实用经验

掌握Photoshop技巧，让你的照片在数字时代焕发新生

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响