鞭牛士报道,6月12日消息,据外电报道,OpenAI首席架构师科林·贾维斯 (Colin Jarvis) 在周三的伦敦人工智能峰会主题演讲中预测大型语言模型将取得重大进步。
贾维斯强调了四个他期待取得重大进展的关键领域:更智能、更便宜的模型、更强的模型定制化、更多音频和视频等多模式以及市场领先的聊天机器人在同样高的水平上的表现。
贾维斯告诉与会者:不要只考虑今天已有的东西,因为事物变化得太快了。
他表示,发展的速度意味着当新的应用程序发布时,现有的能力就会过时。
他敦促企业通过使用语言 AI API 并创造独特的用户体验、数据方法和模型定制来实现差异化。
贾维斯表示,企业构建语言模型驱动服务的关键区别在于利用自己的专有数据。
「你创造的用户体验、你为模型带来的数据、你如何定制它以及你向模型展示的服务,实际上就是你们要脱颖而出并打造真正独一无二的东西的地方。」贾维斯说。「如果你只是围绕这些非常有用的模型之一构建一个包装,那么你与竞争对手没有什么不同。」
贾维斯表示,由于运营成本的降低和模型的更加智能,以前企业由于成本或复杂性而抛弃的用例和用户体验现在可以付诸实践。
例如,他强调了 OpenAI 的模型嵌入成本,称其基本免费——并补充说,以前由于成本或延迟而超出范围的用例现在可以投入部署。
他说:随着 GPT-4o 的推出,其速度是 GPT-4 的两倍,我们看到很多用例,对于用户来说,速度慢得令人痛苦,但实际上速度只是降到了你乐意在那个阶段发货的阈值以下。
「去年我们看到的情况证实,首先模型会变得更智能,然后它们会变得更便宜、更快速。我们拥有更智能的模型,但我们也可以为它们提供廉价的服务。」
聊天机器人军备竞赛
ChatGPT于 2022 年底发布——但聊天机器人市场正变得越来越拥挤,竞争对手包括谷歌的 Gemini 和 Anthropic 的 Claude。
贾维斯将这一领域描述为一场军备竞赛,并强调顶级的以文本为中心的聊天机器人拥有相似的智能水平。
他说,市场上各种高性能模型将继续出现,每个提供商都希望超越彼此,将其机器人的性能水平提高几个百分点。
他说:未来一年值得关注的是,是否有人能够在这些模型的能力方面再次实现从 GPT-3 到 GPTG-4 的飞跃,预计这种情况将持续下去,将有更多的供应商和更加分散、多样化的市场。
增强模型定制
传统上,企业会采用基础模型,然后根据其用例或应用程序对其进行微调。
然而,语言模型在微调方面受到限制,并且在开源模型之上构建需要大量的技术技能和计算工作量。
Jarvis 预测,企业将越来越多地采用基础模型,然后通过强化学习进行后期训练,使其成为相关领域或主题的专家。
贾维斯说:这会带来很多安全隐患,但也会带来很多非常酷的用例,比如让你成为一名农业专家或法律专家。
经过训练成为专家的模型对于客户服务应用来说可能非常有价值,Jarvis 的用途包括为企业提供迄今为止已得到生成式人工智能充分验证的价值。
贾维斯解释说,扎实的语言模型可以自动化某些客户服务功能,同时为人类员工提供支持。
「流程越复杂,你就越需要人类参与,你就越需要一种人类和人工智能共同合作的助手体验。而流程越简单,你就越有可能实现自动化。」贾维斯说。「让人类参与其中并不是人工智能体验的借口,在很多用例中,它也能为用户带来更好的体验。」
增加治疗方式:降低成本
ChatGPT 刚推出时,它处理简单的文本和代码。现在,通过 GPT-4o 模型等更新,它可以处理图像、文本、代码等。
贾维斯表示,像 GPT-4o 这样的模型让企业通过单个 API 调用来运行输入,而不是对每种模式进行单独的调用——从而降低了运行模型的成本。
「这让事情变得更快,」他说。「随着这一变化,大量依赖于低延迟交互和模式变化的全新用户体验将变得可用。」
OpenAI 在其春季活动中演示了交互式多模式聊天机器人,该公司的首席架构师表示,它们是语言模型元数据的下一个变化——一个语言模型下的更多模式。
「我们最终是否会看到一个模型,我可以对它讲话,然后它会根据我所说的内容制作视频,实际上,模态不再是障碍,我只需要接受我可以按照我想要的方式与这个 API 进行交互。」贾维斯说。