作者|赵健
在距离ChatGPT发布即将一周年之际,OpenAI今天凌晨在旧金山举办了首届开发者大会DevDay。
首先,OpenAI CEO 山姆·阿尔特曼上台回顾了过去一年发布的里程碑产品:ChatGPT,以及在4月发布的GPT-4——仍然是世界上最强大的模型。此外,ChatGPT还推出新的语音与图像功能,让ChatGPT可以看、听和说话;推出企业版以及DALL-E等。
阿尔特曼还公布了OpenAI最新的数据:有超过200万开发人员在其API上构建“广泛的用例”,并服务了92%的财富500强公司。同时,ChatGPT本身每周约有1亿活跃用户。
微软CEO萨蒂亚·纳德拉也来到了现场,他曾主导了微软对OpenAI的投资。纳德拉表示:“我们提供最好的系统,你们提供最好的模型。”纳德拉也多次提到了基于GPT-4模型打造的副驾驶产品Copilot。
OpenAI在本次开发者大会上分享了数十项新增功能和改进,并降低了平台许多部分的价格。这些包括:
·ChatGPT的自定义版本——GPTs,并发布“GPT商店”;
·新的GPT-4 Turbo模型,功能更强大、更便宜并且支持128K上下文窗口;
·新的Assistants(助手)API,使开发人员可以更轻松地构建自己的辅助 AI 应用程序,这些应用程序有特定目标并可以调用模型和工具;
·平台中的新多模态功能,包括视觉、图像创建(DALL·E 3)和文本转语音(TTS)。
OpenAI正在围绕大模型,构建自己的生态帝国。
1.ChatGPT的“App Store”
OpenAI表示,自从推出ChatGPT以来,人们一直在寻求定制ChatGPT以适应他们特定的使用方式的方法。OpenAI在7月推出了自定义指令,可设置一些首选项,但不断有人要求更多控制。许多高级用户都会维护一份精心设计的提示和指令集列表,并将它们手动复制到ChatGPT中。
GPTs现在可以完成所有这些工作。
GPTs是一个UGC平台。OpenAI相信最令人难以置信的GPT将来自社区的构建者,无论是教育家、教练,还是只是喜欢构建有用工具的人,都不需要了解编码来制作工具并分享专业知识。
从今天开始,用户可以创建GPTs并公开共享。本月晚些时候,OpenAI将推出GPT商店,其中包含经过验证的构建者的作品。一旦进入商店,GPTs就可以被搜索到,并且可能会登上排行榜。OpenAI还将重点关注在生产力、教育和“只是为了好玩”等类别中遇到的最有用和最令人愉快的GPTs。
就像苹果App Store的开发者一样,用户还可以根据使用其开发的GPTs的人数来赚钱。
图片来自OpenAI
关于隐私和安全问题,用户可以通过ChatGPT控制数据。用户与GPTs的聊天不会与构建者共享。如果GPTs使用第三方API,用户可以选择是否可以将数据发送到该API。当构建者使用操作或知识定制自己的GPTs时,构建者可以选择用户与该GPTs的聊天是否可用于改进和训练模型。这些选择建立在用户现有的隐私控制之上,包括选择将整个帐户排除在模型训练之外的选项。
OpenAI还建立了新的审查机制,旨在防护用户共享有害的GPTs,包括涉及欺诈活动、仇恨内容或成人主题的 GPTs。
OpenAI表示,GPTs将继续变得更有用、更智能,用户最终将能够让它们承担现实世界中的实际任务,这些系统通常被称为“代理(Agents)”。OpenAI认为,逐步迈向这一未来非常重要,因为这需要认真的技术和安全工作,以及社会适应的时间。
对于开发者而言,除了使用内置功能之外,还可以通过向GPTs提供一个或多个API 来自定义操作。与插件一样,操作允许GPTs集成外部数据或与现实世界交互,将GPTs连接到数据库、将其插入电子邮件或使它们成为购物助手。
对于企业客户而言,可以部署仅供内部人员使用的GPTs。OpenAI介绍。Amgen、Bain 和 Square 等早期客户已经在利用内部 GPTs来做一些事情,例如制作体现其品牌的营销材料、帮助支持人员回答客户问题或帮助新软件工程师入职。
企业用户在本周三就可以使用GPTs。OpenAI强调,与ChatGPT Enterprise上的所有使用者一样,OpenAI不会使用企业与GPTs的对话来改进模型。
OpenAI表示,希望更多的人参与到塑造人工智能的行为方式之中,这对于OpenAI构建造福人类的安全通用人工智能的使命至关重要。
2.新的模型与开发者产品,
具有 128K 上下文的 GPT-4 Turbo
OpenAI于3月份发布了GPT-4 的第一个版本,并于7月份向所有开发人员开放。今天,OpenAI推出该模型的下一代GPT-4 Turbo的预览。
此前,OpenAI的所有模型的训练数据截止时间为2021年9月,而GPT-4 Turbo了解截至2023年4月的世界事件。GPT-4 Turbo具有128k上下文窗口,因此可以在单个提示中容纳相当于300多页文本的内容。
GPT-4 Turbo 可供所有付费开发者通过gpt-4-1106-preview API 进行尝试,OpenAI计划在未来几周内发布稳定的生产就绪模型。
GPT-4 Turbo的功能更新包括:函数调用更新、改进的指令跟随和 JSON 模式、可重复的输出和对数概率等,此外,OpenAI还发布了新版本的GPT-3.5 Turbo,默认支持 16K 上下文窗口。
助手API、检索和代码解释器
OpenAI发布的Assistants API是帮助开发人员在自己的应用程序中构建类似代理体验的第一步。
助手是一种专门构建的人工智能,具有特定的指令,利用额外的知识,并且可以调用模型和工具来执行任务。新的 Assistants API 提供了代码解释器和检索以及函数调用等新功能,可以处理用户以前必须自己完成的大量繁重工作,并能够构建高质量的 AI 应用程序。
这个 API 的设计是为了灵活性。用例范围包括基于自然语言的数据分析应用程序、编码助手、人工智能驱动的假期规划器、语音控制的 DJ、智能视觉画布等等。助理还可以根据需要调用新工具,包括:代码解释器、检索与函数调用。
API 中的多模态模式
GPT-4 Turbo 可以接受图像作为聊天完成 API中的输入,从而实现生成标题、详细分析现实世界图像以及阅读带有图形的文档等用例。例如,BeMyEyes 使用这项技术帮助盲人或弱视人士完成识别产品或浏览商店等日常任务。OpenAI计划为主要的 GPT-4 Turbo 模型提供视觉支持,作为其稳定版本的一部分。定价取决于输入图像的大小。例如,将 1080×1080 像素的图像传递给 GPT-4 Turbo 的成本为 0.00765 美元。
开发人员可以通过图像API指定模型,将OpenAI向ChatGPT Plus和企业用户推出的DALL·E 3 直接集成到他们的应用程序和产品中。Snap、可口可乐和 Shutterstock 等公司已使用 DALL·E 3 以编程方式为其客户和活动生成图像和设计。OpenAI提供不同的格式和质量选项,每生成一张图像的起价为 0.04 美元。
开发人员现在可以通过文本转语音 API从文本生成人类质量的语音。新 TTS 模型提供六种预设声音可供选择以及两种模型变体——tts-1与tts-1-hd,tts-1针对实时用例进行了优化,tts-1-hd针对质量进行了优化。每输入 1000 个字符起价为 0.015 美元。
图片来自OpenAI开发者大会截图
OpenAI正在发布Whisper large-v3,这是开源自动语音识别模型 (ASR) 的下一个版本,它的特点是跨语言性能得到了改进。OpenAI计划在不久的将来在API中支持Whisper v3。
OpenAI还开源了Consistency Decoder,这是稳定扩散 VAE 解码器的替代品。该解码器改进了与 Stable Diffusion 1.0+ VAE 兼容的所有图像,在文本、面部和直线方面有显著改进。
3.OpenAI也打“价格战”
针对开发者关心的价格问题,OpenAI表示正在降低整个平台的多个价格,以便将节省的费用转嫁给开发者(以下所有价格均以每 1,000 个token表示):
·GPT-4 Turbo 输入token比 GPT-4 便宜 3 倍,为 0.01 美元,输出token便宜 2 倍,为 0.03 美元。
·GPT-3.5 Turbo 输入token比之前的 16K 型号便宜 3 倍,价格为 0.001 美元,输出token便宜 2 倍,价格为 0.002 美元。之前使用 GPT-3.5 Turbo 4K 的开发人员受益于输入token减少 33%,价格为 0.001 美元。这些较低的价格仅适用于今天推出的新款 GPT-3.5 Turbo。
·经过微调的 GPT-3.5 Turbo 4K 模型输入token减少了 4 倍,价格为 0.003 美元,输出token便宜了 2.7 倍,价格为 0.006 美元。微调还通过新的 GPT-3.5 Turbo 型号以与 4K 相同的价格支持 16K 上下文。这些新价格也适用于微调型号gpt-3.5-turbo-0613。
图片来自OpenAI
OpenAI正在创建一个用于GPT-4 微调的实验性访问程序。初步结果表明,与 GPT-3.5 微调实现的实质性收益相比,GPT-4 微调需要更多的工作才能对基本模型实现有意义的改进。
对于需要比微调所能提供的更多自定义的组织,特别适用于具有极大专有数据集——至少数十亿token的组织,OpenAI还启动了自定义模型计划,为选定的组织提供了与专门的 OpenAI 研究人员小组将定制 GPT-4 训练到其特定领域。这包括修改模型训练过程的每一步,从进行额外的特定领域预训练,到运行针对特定领域定制的自定义强化学习后训练过程。组织将拥有对其定制模型的独家访问权。
(封面图来自OpenAI开发者大会截图)
参考资料:
https://www.youtube.com/watch?v=U9mJuUkhUzk
https://openai.com/blog/introducing-gpts
https://openai.com/blog/new-models-and-developer-products-announced-at-devday