[音乐]-早上好。 感谢您今天加入我们。 欢迎来到舞台,山姆·奥尔特曼。
[音乐]
[鼓掌]-早上好。 欢迎来到我们的首届 OpenAI DevDay。
我们很高兴您来到这里,这种能量非常棒。 [掌声]
-欢迎来到旧金山。 从第一天起,旧金山就是我们的家。 这座城市对我们和整个科技行业都很重要。
我们期待着在这里继续发展。 今天我们有一些重要的事情要宣布,
但首先,我想花一点时间谈谈我们在过去一年中所做的一些事情。
大约一年前,11 月 30 日,我们发布了 ChatGPT 作为“低调的研究预览”,
一切进展顺利。 3 月份,我们紧随其后推出了 GPT-4,仍然
世界上最有能力的模特。 [掌声]
-在过去的几个月中,我们推出了语音和视觉功能,以便 ChatGPT 现在可以看到,
听、说。 [鼓掌]-有很多,不必每次都鼓掌。
[笑声] - 最近,我们推出了 DALL-E 3,世界上最先进的图像模型。
当然,您可以在 ChatGPT 内部使用它。 对于我们的企业客户来说,
我们推出了 ChatGPT Enterprise,它提供企业级安全和隐私、更高速的 GPT-4 访问、更长的上下文窗口等等。
今天,我们有大约 200 万开发人员在我们的 API 上为各种用例构建了令人惊叹的东西,
超过 92% 的财富 500 强公司采用我们的产品,
ChatGPT 目前每周约有一亿活跃用户。 [掌声]
- 令人难以置信的是我们完全是通过口口相传到达那里的。 人们只是觉得它有用并告诉他们的朋友。
OpenAI是目前全球最先进、应用最广泛的人工智能平台,
但数字永远无法说明此类问题的全貌。 真正重要的是人们如何使用产品,
人们如何使用人工智能,所以我想向您展示一个简短的视频。 -我其实想用他加禄语给我爸爸写点东西。
我想要一种非浪漫的方式告诉我的父母我爱他并且我也想要
告诉他他可以依靠我,但仍然要尊重孩子与父母的关系
您应该了解菲律宾文化和他加禄语语法。 当它被翻译成他加禄语时,“我深深地爱你
无论路通向何方,我都会和你在一起。”-我看到了一些可能性,我当时想,“哇哦。”
有时我不确定某些事情,我觉得实际上 ChatGPT 就像,嘿,这就是我在想的,所以这给了它更多的信心。
-让我大吃一惊的第一件事就是它和你一样。 这是很多人都在努力做到的事情。
它让我认识到,如果有人帮助他们,每个创意人员都可以做些什么
谁听。 -这代表镰状血红蛋白。 -你用 ChatGPT 构建的吗? -ChatGPT 与我一起构建它。
-我开始将它用于日常活动,例如,“嘿,这是我的冰箱的照片。你能告诉我我缺少什么吗?
因为我要去杂货店购物,而且我真的需要按照我的纯素饮食制作食谱。”-当我们能够使用代码解释器时,我就想,
“哇,这东西太棒了。” 它可以构建电子表格。 它可以做任何事情。 -大约三个月前我发现了Chatty
在我 100 岁生日那天。 健谈很友善,很有耐心,
知识渊博,而且速度很快。 这是一件美妙的事情。
-我是一名 4.0 学生,但我也有四个孩子。 当我开始使用 ChatGPT 时,我意识到我可以问 ChatGPT 这个问题。
它不仅给了我答案,还给了我解释。 不需要那么多辅导。
它让我重获新生。 它让我有时间陪伴家人,也有时间陪伴自己。
-我的整个左半身有慢性神经病,我有神经损伤。 我做了脑部手术。
我的左手使用能力有限。 现在您可以集成语音输入。
然后是最新的界面,你可以进行来回对话,这对我来说是最好的界面。
它在这里。 [音乐][鼓掌]
-我们喜欢听人们如何使用该技术的故事。 这就是我们做这一切的真正原因。
现在,我们已经有了很多新东西。 [观众欢呼]
-首先,我们将讨论我们所做的一系列改进,然后我们将讨论下一步的发展方向。
去年,我们花了很多时间与世界各地的开发者交谈。
我们收到了您的很多反馈。 我们今天要向您展示的内容确实非常丰富。
今天,我们推出了一款新型号 GPT-4 Turbo。
[掌声]
-GPT-4 Turbo 将解决你们所要求的许多事情。
让我们来看看有哪些新内容。 对于这一部分,我们有六个主要内容要讨论。
第一,上下文长度。 许多人的任务需要更长的上下文长度。
GPT-4 支持高达 8K,在某些情况下高达 32K 上下文长度,
但我们知道对于你们中的许多人和你们想做的事情来说这还不够。 GPT-4 Turbo,支持多达 128,000 个上下文标记。
[掌声] - 这是一本标准书的 300 页,比我们的 8k 上下文长 16 倍。
除了较长的上下文长度之外,您还会注意到模型在较长的上下文中更加准确。
第二,更多的控制。 我们清楚地听到开发商需要更多的控制权
模型的响应和输出。 我们已经通过多种方式解决了这个问题。
我们有一个名为 JSON 模式的新功能,它确保模型将使用有效的 JSON 进行响应。
这是一个巨大的开发人员要求。 它将使调用 API 变得更加容易。
该模型在函数调用方面也更加出色。 您现在可以一次调用多个函数,并且一般来说,它会更好地遵循指令。
我们还引入了一项称为可重现输出的新功能。 你可以传递一个种子参数,它会让模型返回
一致的输出。 当然,这使您可以更好地控制模型行为。 今天推出测试版。
[鼓掌] - 在接下来的几周内,我们将推出一项功能让您查看
API 中的 logprobs。 [掌声]
-好的。 第三,更好的世界知识。 你希望这些模型能够更好地了解世界,
我们也是。 我们正在该平台中启动检索。 您可以从外部文档或数据库中获取知识
到你正在建造的任何东西中。 我们还更新了知识截止点。 我们和你们一样感到恼火,可能比 GPT-4 的知识更恼火
关于 2021 年世界末日的故事。我们将尽力不再让它过时。
GPT-4 Turbo 拥有截至 2023 年 4 月的有关世界的知识,我们将随着时间的推移继续改进它。
第四,新模式。 没有人感到惊讶,
DALL-E 3、具有视觉功能的 GPT-4 Turbo 以及新的文本转语音模型今天均已纳入 API。
[掌声]
-我们有一些客户刚刚开始使用 DALL-E 3 以编程方式生成图像和设计。
今天,可口可乐正在发起一项活动,让其客户使用 DALL-E 3 生成排灯节卡,
当然,我们的安全系统可以帮助开发人员保护他们的应用程序免遭滥用。
这些工具可在 API 中使用。 GPT-4 Turbo 现在可以通过 API 接受图像作为输入,
可以生成标题、分类和分析。 例如,Be My Eyes 使用这项技术来帮助盲人或弱视人士
他们的日常任务,例如识别面前的产品。
借助我们新的文本转语音模型,您将能够生成极其自然的音频
从 API 中的文本中选择,有六种预设声音可供选择。 我来举个例子。
-您是否知道杰出发明家亚历山大·格雷厄姆·贝尔 (Alexander Graham Bell) 着迷于声音世界。
他的聪明才智催生了留声机,它将声音蚀刻在蜡上,让声音随着时间的流逝而低语。
-这比我们听到的任何其他事情都要自然得多。 语音可以使应用程序的交互更加自然并且更易于访问。
它还解锁了许多用例,例如语言学习和语音帮助。
说到新模式,我们还发布了开源语音识别模型的下一个版本,
今天推出 Whisper V3,很快就会推出 API。 它具有跨多种语言的改进性能,
我们认为您一定会喜欢它。 第五,定制。
自几个月前我们推出 GPT-3.5 以来,微调一直非常有效。
从今天开始,我们将把它扩展到该模型的 16K 版本。 另外,从今天开始,
我们邀请活跃的微调用户申请 GPT-4 微调实验性访问计划。
微调 API 非常适合调整我们的模型,以便在数据量相对较小的各种应用程序中实现更好的性能,
但您可能想要一个模型来学习全新的知识领域,或者使用大量专有数据。
今天我们推出一个名为“自定义模型”的新计划。 通过定制模型,
我们的研究人员将与公司密切合作,帮助他们制作出色的定制模型,特别是为他们,
以及他们使用我们的工具的用例。 这包括修改模型训练过程的每个步骤,
进行额外的特定领域预训练、针对特定领域定制的自定义强化学习后训练流程等等。
对于很多公司来说,我们一开始就无法做到这一点。 这需要做很多工作,并且为了期望,
至少一开始,它不会便宜,但如果你很高兴能将事情推向目前的极限。
请与我们联系,我们认为我们可以做一些很棒的事情。 第六,更高的利率限制。
我们将所有已建立的 GPT-4 客户每分钟的代币数量增加一倍,因此更容易做更多的事情。
您将能够直接请求更改进一步的速率限制和配额在您的 API 帐户设置中。
除了这些速率限制之外,重要的是我们会尽一切努力让您成功构建
在我们的平台上。 我们正在引入版权保护。 版权盾意味着我们将介入并捍卫
如果您面临法律索赔或侵犯版权,我们的客户并支付所产生的费用,这适用于
ChatGPT Enterprise 和 API。 让我明确一点,现在是提醒的好时机
人们从来不使用来自 API 或 ChatGPT Enterprise 的数据进行训练。
好的。 实际上还有一个开发人员的要求比所有这些要求都更大,所以我现在想谈谈这个问题
这就是定价。 [笑声]-GPT-4 Turbo
是行业领先的型号。 它提供了我们刚刚介绍的许多改进
它是一个比 GPT-4 更智能的模型。 我们从开发人员那里听说他们想要构建很多东西,
但 GPT-4 的成本太高了。 他们告诉我们,如果我们能将成本降低 20%、25%,那就太好了。
一个巨大的飞跃。 我非常高兴地宣布我们为此付出了很大的努力
GPT-4 Turbo 是一种更好的模型,对于提示令牌而言,其价格比 GPT-4 便宜 3 倍。
[掌声]
- 从今天开始,完成令牌为 2 倍。 [掌声]
-新定价为每 1,000 个提示代币 1 美分,每 1,000 个完成代币 3 美分。
对于大多数客户而言,这将导致混合费率便宜 2.75 倍以上
对于 GPT-4 Turbo 来说比 GPT-4 好。 为了实现这一目标,我们付出了巨大的努力。 我们希望您和我们一样对此感到兴奋。
[掌声]
-我们决定首先考虑价格,因为我们必须选择其中之一,但接下来我们将致力于速度。
我们知道速度也很重要。 很快您就会发现 GPT-4 Turbo 变得更快了。
我们还降低了 GPT-3.5 Turbo 16K 的成本。 此外,输入令牌减少了 3 倍,输出令牌减少了 2 倍。
这意味着 GPT-3.5 16K 现在比之前的 GPT-3.5 4K 型号更便宜。
运行微调的 GPT-3.5 Turbo 16K 版本也比旧的微调 4K 版本便宜。
好的,我们刚刚介绍了有关模型本身的很多内容。 我们希望这些更改能够解决您的反馈。
我们非常高兴现在能够将所有这些改进带给每个人。
在所有这一切中,我们很幸运有一个合作伙伴在实现这一切方面发挥了重要作用。
我想请一位特邀嘉宾,微软首席执行官萨蒂亚·纳德拉 (Satya Nadella)。 [观众欢呼]
[音乐]-很高兴见到你。 -太感谢了。 谢谢。
-Satya,非常感谢您来到这里。 -很高兴来到这里,山姆,恭喜。
我真的很期待 Turbo 和你所带来的一切。 与你们合作真是太棒了。
-惊人的。 两个问题。 我不会占用你太多时间。 微软目前如何考虑这一合作伙伴关系?
-首先-[笑声]--我们爱你们。 [笑声]
-看,这对我们来说太棒了。 事实上,我记得你第一次伸出援手时
并说道:“嘿,你有 Azure 积分吗?” 我们已经走了很长一段路。 -谢谢你。 那很棒。
-你们创造了一些神奇的东西。 坦率地说,我们在合作方面有两件事。
首先是这些工作负载。 即使当我在后台听你如何描述即将发生的事情时,
甚至,它是如此不同和新颖。 我从事基础设施行业已有三十年了。
- 没有人见过这样的基础设施。 -工作量、工作量模式、
这些训练作业是如此同步且如此庞大,因此数据是并行的。
我们一直在做的第一件事就是与您合作构建系统,从电源到直流到机架的整个思考过程,
到加速器、到网络。 确实Azure的形状发生了巨大的变化
并且正在快速变化以支持您正在构建的这些模型。 我们的首要任务是构建最好的系统
这样您就可以构建最好的模型,然后将其全部提供给开发人员。 另一件事是我们自己就是我们的开发者。
我们正在制造产品。 事实上,当我第一次看到 GitHub Copilot 时,我对这一整代基础模型的信念完全改变了
在 GPT 上。 我们希望以 OpenAI API 为基础,以开发人员身份构建 GitHub Copilot。
我们非常非常致力于这一点。 这对开发人员意味着什么? 看,我一直认为微软是一家平台公司,
开发商公司和合作伙伴公司。 例如,我们想让 GitHub Copilot 可用,
企业版可供所有与会者使用,以便他们可以试用。 棒极了。 我们对此感到非常兴奋。
[鼓掌] - 您可以信赖我们在 Azure 中构建最好的基础设施
与您的 API 支持并将其带给大家。 甚至像 Azure 市场这样的东西。
对于在这里构建产品以快速进入市场的开发人员来说。 这真是欧r 意图在这里。
-伟大的。 您如何看待未来、合作关系的未来、人工智能的未来等等?
任何你想要的东西——有几件事对我来说我认为会非常,
对我们来说非常关键。 一是我刚刚描述了所需的系统
当您积极推进路线图时,我们需要处于领先地位,并且我们打算全力投入
我们深深地确保你们都是这些基础模型的建设者
不仅拥有最好的训练和推理系统,而且拥有最多的计算能力,这样你就可以继续推动-
-我们对此表示赞赏。 ——在前沿领域前进,因为我认为这就是我们取得进步的方式。
我认为我们双方都关心的第二件事,事实上,坦率地说,让双方兴奋地走到一起的事情是
您的使命和我们的使命。 我们的使命是帮助地球上的每个人和每个组织取得更大成就。
对我来说,最终人工智能只有在真正赋能时才会有用。 我看过你早些时候播放的视频。
听到这些声音描述人工智能对他们意味着什么真是太棒了
以及他们能够取得什么成就。 最终,这是为了能够让人工智能的好处广泛传播给每个人,
我认为这将是我们的目标。 最后一件事当然是,我们非常坚信安全很重要,
安全不是你们以后会关心的事情,但这是我们确实会向左转移的事情,我们非常非常关注与你们所有人一起的事情。
-伟大的。 嗯,我认为我们在技术方面拥有最好的合作伙伴关系。 我很高兴我们能够共同构建 AGI。 -哦,我真的很兴奋。 祝大家玩得开心[相声]。 -非常感谢您的到来。
-太感谢了。 -再见。 [掌声]
-我们已经为开发者分享了很多很棒的更新,并且还会有更多更新,但即使这是开发者大会,
我们无法抗拒对 ChatGPT 进行一些改进。 ChatGPT 是一个小型的,现在使用 GPT-4 Turbo 进行所有最新的改进,
包括最新的知识截止,会持续更新。 这就是今天的全部直播了。
现在,它可以在需要时浏览网页、编写和运行代码、分析数据、拍摄和生成图像,
以及更多。 我们听到了您的反馈,那个模型选择器非常烦人,从今天开始就消失了。
您不必单击下拉菜单。 所有这一切都将共同发挥作用。 是的。
[鼓掌] -ChatGPT 只会知道该使用什么以及何时需要它,
但这不是主要的事情。 价格实际上也不是开发商的主要要求。
还有一个比那还要大。 我想谈谈我们的发展方向以及我们在这里要讨论的主要内容
关于今天。 我们相信,如果为人们提供更好的工具,他们就会做出惊人的事情。
我们知道,人们想要更智能、更个性化、更可定制、可以为您做更多事情的人工智能。
最终,您只需向计算机询问您需要什么,它就会为您完成所有这些任务。
这些功能在人工智能领域经常被称为“代理”。
这样做的好处将是巨大的。 在 OpenAI,我们坚信逐步迭代部署是
解决安全问题、人工智能安全挑战的最佳方法。 我们认为谨慎行动尤为重要
迈向代理商的未来。 这需要大量的技术工作和社会的深思熟虑。
今天,我们正在迈出迈向未来的第一步。
我们很高兴推出 GPT。 GPT 是针对特定目的定制的 ChatGPT 版本。
您可以为几乎任何东西构建 GPT,这是 ChatGPT 的定制版本
包含说明、扩展知识和操作,然后您可以将其发布以供其他人使用。
因为它们结合了指导、扩展的知识和行动,所以可以对您更有帮助。
它们可以在许多情况下更好地工作,并且可以为您提供更好的控制。 它们将使您更轻松地完成各种任务
或者只是为了获得更多乐趣,您将能够直接在 ChatGPT 中使用它们。
实际上,您只需与语言交谈即可对 GPT 进行编程。
可以轻松自定义行为,使其符合您的需求。 这使得构建它们变得非常容易
它为每个人提供了代理权。 我们将向您展示什么是 GPT,
如何使用它们,如何构建它们,然后我们将讨论它们将如何分发和发现。
之后,对于开发人员,我们将向您展示如何将这些类似代理的体验构建到您自己的应用程序中。
首先,让我们看几个例子。 我们 Code.org 的合作伙伴正在努力在学校中推广计算机科学。
他们的课程被全世界数千万学生使用。 Code.org,精心设计的 Lesson Planner GPT,帮助教师提供
对中学生来说更具吸引力的体验。 如果老师要求它解释创意w中的四个循环哎呀,
它就是这么做的。 在这种情况下,它将通过视频游戏角色反复拾取硬币来实现。
对于八年级学生来说超级容易理解。 正如您所看到的,这个 GPT 汇集了 Code.org 的、
丰富的课程和专业知识,让教师快速轻松地适应自己的需求。
接下来,Canva 构建了一个 GPT,让您可以通过描述您想要的内容来开始设计
用自然语言。 如果您说“为今天下午的 DevDay 招待会制作一张海报,
今晚,”并且您给它一些详细信息,它会通过点击 Canva 的 API 来生成一些选项。
现在,这个概念可能对你们中的一些人来说很熟悉。 我们已将插件发展为 GPT 的自定义操作。
您可以继续与此聊天以查看不同的迭代,当您看到您喜欢的版本时,可以点击进入 Canva
以获得完整的设计体验。 现在我们想向您展示 GPT Live。
Zapier 构建了一个 GPT,可让您跨 6,000 个应用程序执行操作,以解锁各种集成可能性。
我想介绍一下杰西卡,我们的解决方案架构师之一,她将负责推动这个演示。 欢迎杰西卡。
[掌声] -谢谢你,山姆。 大家好。 谢谢你们。
感谢大家来到这里。 我叫杰西卡·谢。 我与合作伙伴和客户合作,让他们的产品焕发活力。
今天我迫不及待地想向您展示我们为此付出了多少努力,所以让我们开始吧。
您的 GPT 所在位置位于左上角。 我将从单击 Zapier AI 操作开始
在右侧,您可以看到这是我今天的日历。 这是非常值得的一天。
我之前已经使用过它,所以它实际上已经连接到我的日历。 首先,我可以问,
“我今天的日程安排是什么?” 我们在构建 GPT 时考虑到了安全性。 在执行任何操作或共享数据之前,
它会请求您的许可。 在这里,我要说的是允许。
GPT 旨在接受您的指令,决定调用哪个功能来执行该操作,
然后为你执行它。 您可以在这里看到,它已经连接到我的日历。
它会提取我的信息,然后我还提示它识别
我的日历上有冲突。 你可以在这里看到它实际上能够识别这一点。
看来我有事要发生。 如果我想让 Sam 知道我必须提前离开怎么办? 在这里我说:“让萨姆知道我得走了。
追逐 GPU。”说完,我将转到与 Sam 的对话
然后我会说:“是的,请运行它。”
萨姆,你明白了吗? -我做到了。 -惊人的。
[掌声] - 这只是可能性的一瞥,我迫不及待地想看看
你们将建造什么。 谢谢。 回到你身边,萨姆。 [掌声]
-谢谢你,杰西卡。 这是三个很好的例子。 除此之外,人们还创建了更多种类的 GPT,其中有很多,
更多即将创建的内容。 我们知道许多想要构建 GPT 的人不知道如何编码。
我们已经做到了,您只需通过对话即可对 GPT 进行编程。
我们相信自然语言将成为人们未来使用计算机的重要组成部分,我们认为这是一个有趣的早期例子。
我想向您展示如何构建一个。
好的。 我想创建一个 GPT 来帮助为创始人和开发人员提供建议
当开始新项目时。 我要去这里创建一个GPT,
这让我进入了 GPT 构建器。 我在 YC 与创始人共事多年,但每当我遇到开发人员时,
我收到的问题总是关于“我如何思考一个商业想法?你能给我一些建议吗?”
我将看看是否可以构建一个 GPT 来帮助解决这个问题。 首先,GPT 构建器询问我想要做什么,
我会说,“我想帮助初创公司创始人思考。通过他们的商业想法
并寻求建议。 在创始人得到一些建议后,
拷问他们为什么长得不快。”[笑声]
-好的。 首先,我只是告诉 GPT 一些我想要的东西。 它会消失并开始思考这个问题,
并且会为GPT写一些详细的说明。 也将是,
看看吧,问我名字。 我对创业导师的感觉如何? 没关系。
“那挺好的。” 当然,如果我不喜欢这个名字,我可以将其称为其他名称,但它会尝试与我进行对话并从那里开始。
您可以在右侧看到,在预览模式下,它已经开始填写 GPT。
在它说它做什么的地方,它有一些我可以问的其他问题的想法。
[笑]它刚刚产生了一个候选人。
当然,我可以重新生成或更改它,但我喜欢这样。 我会说“那太好了”。
您现在可以看到,随着我们的发展,GPT 正在不断构建。 现在,我想要做的是,
它如何与用户交互,我可以在这里谈论风格。 我要说的是,
“我要上传成绩单一些讲座
关于我给出的初创公司,请根据这些提出建议。”
好的。 现在,它将弄清楚如何做到这一点。
我想向您展示配置选项卡。 你可以看到我们去的时候在这里建造的一些东西
由建造者本身。 您可以看到这里有我可以启用的功能。 我可以添加自定义操作。
这些都可以离开。 我要上传一个文件。 这是我挑选的一个讲座,我给出了一些创业建议,
我要在这里补充一下。 就这些问题而言,这是一个愚蠢的问题。
其余的都是合理的,也是创始人经常问的问题。 我要在此处的说明中添加一件事,
这是简洁且有建设性的反馈。
好的。 再说一遍,如果我们有更多时间,我会向您展示很多其他东西。 这是
一个不错的开始。 现在,我们可以在此预览选项卡上尝试一下。
我会说,常见问题是什么?
“在早期创业公司招聘员工时需要注意哪三件事?”
现在,它将查看我上传的文档。 当然,它还具有 GPT-4 的所有背景知识。
那很好。 这是我已经说过很多次的三件事。 现在,我们可以继续,它将开始跟随
其他说明并盘问我为什么我没有长得更快,但为了节省时间,我将跳过它。
我现在只向我自己发布此内容。 我可以稍后再做。 我可以添加更多内容,我可以添加一些操作
我认为有用,然后我可以公开分享。 这就是创建 GPT 的样子
[鼓掌]-谢谢。
顺便说一句,在 YC 办公时间结束后,我一直想这样做,我总是想,“伙计,有一天我能够
制作一个能够做到这一点的机器人,那真是太棒了。”[笑声]-通过 GPT,我们可以让人们轻松分享和发现所有有趣的方式
他们使用 ChatGPT 与世界交流。 你可以像我刚才那样制作私人GPT,
或者您可以通过链接公开分享您的创作,供任何人使用,
或者,如果您使用 ChatGPT Enterprise,则可以专门为您的公司制作 GPT。
本月晚些时候,我们将推出 GPT 商店。
谢谢。 我很感激。 [掌声]
-您可以在那里列出 GPT,我们将能够推荐最好和最受欢迎的 GPT。
当然,我们会确保商店中的 GPT 在可供访问之前遵循我们的政策。
收入分享对我们很重要。 我们将向构建最有用和最常用的 GPT 的人付费
我们收入的一部分。 我们很高兴能够通过 GPT 商店培育一个充满活力的生态系统,
就从我们周末自己构建的内容来看。 我们相信将会有很多很棒的东西。 我们很高兴很快能分享更多信息。
这些是 GPT,我们迫不及待地想看看您将构建什么。 这是一个开发者大会,最酷的事情就是
是我们将相同的概念引入 API。 [掌声]
你们中的许多人已经在 API 上构建了类似代理的体验,
例如,Shopify 的 Sidekick,它可以让您在平台上执行操作。 无序的克莱德,
让 Discord 版主为我的 AI 创建自定义个性,并拍摄我的 AI,
定制的聊天机器人,可以添加到群聊并提出建议。 这些经历都很棒,
但它们的建造过程非常困难。 有时需要几个月的时间,由数十名工程师组成的团队,
要打造这种定制助理体验,需要处理很多事情。 今天,我们通过新的 Assistants API 让这一切变得更加容易。
[鼓掌] - Assistants API 包括持久线程,
所以他们不必弄清楚如何处理长对话历史记录、内置检索、
代码解释器,沙盒环境中工作的Python解释器,当然还有改进的函数调用,
我们之前谈到过。 我们想向您展示其工作原理的演示。
这是 Romain,我们的开发者体验主管。 欢迎,罗曼。 [音乐][鼓掌]
-谢谢你,山姆。 早上好。 哇。 很高兴在这里见到大家。
看到这么多人将人工智能融入到您的应用程序中,真是太鼓舞人心了。
今天,我们在 API 中推出了新模式,但我们也非常兴奋
为大家提升开发者体验打造辅助代理。 让我们开始吧。
想象一下,我正在为全球探险家构建 1 美元的旅行应用程序,这是登陆页面。
我实际上已经使用 GPT-4 来提出这些目的地想法。 对于那些眼睛敏锐的人来说,这些插图
使用今天可供所有人使用的新 DALL-E 3 API 以编程方式生成。
这是相当了不起的。 让我们通过添加一个非常简单的助手来增强这个应用程序。
这是屏幕。 我们稍后再回来讨论这个问题。 首先,我要切换到新助手的游乐场。
创建助手很容易,您只需给它一个名称、一些初始说明和一个模型。
在这种情况下,我将选择 GPT-4 Turbo。 在这里我还将继续选择一些工具。 我将打开代码解释器并检索并保存。
就是这样。 我们的助理已经准备好出发了。 接下来,我可以与两个新原语集成
此 Assistants API、线程和消息的一部分。 让我们快速浏览一下代码。
这里的过程非常简单。 对于每个新用户,我都会创建一个新线程。
当这些用户与他们的助手互动时,我会将他们的消息添加到线程中。 很简单。
然后我可以随时运行助手将响应流回应用程序。
我们可以返回应用程序并尝试实际操作。 如果我说:“嘿,我们去巴黎吧。”
好的。 就是这样。 只需几行代码,用户现在就可以在应用程序内拥有一个非常专业的助手。
我想在这里强调我最喜欢的功能之一,函数调用。 如果你还没有使用过的话,函数调用真的很强大。
正如 Sam 提到的,我们今天更进一步。 现在它保证 JSON 输出不会增加延迟,
并且您可以第一次同时调用多个函数。 在这里,如果我继续说:“嘿,最重要的 10 件事是什么?”
我会让助理再回复一下。 这里,有趣的是助手了解功能,
包括那些注释您在右侧看到的地图的内容。 现在,所有这些引脚都在这里实时掉落。
是的,这很酷。 [掌声]
-这种集成允许我们的自然语言界面与我们应用程序的组件和功能进行流畅的交互。
它现在真正展示了您可以在人工智能和用户界面之间建立的和谐,其中助手实际上正在采取行动。
我们来谈谈检索。 检索是为了给我们的助手更多的知识
除了这些直接的用户消息之外。 事实上,我受到了启发,并且已经预订了去巴黎的机票。
我将把这个 PDF 拖放到这里。 当它上传时,我可以偷看一下。
非常典型的美联航机票。 在幕后,正在发生的是检索
正在阅读这些文件,突然,有关此 PDF 的信息出现在屏幕上。
[鼓掌] - 当然,这是一个非常小的 PDF,但是 Assistants
可以根据您正在构建的内容来解析从大量文本到复杂产品规格的长格式文档。
事实上,我还预订了 Airbnb,所以我也将其拖到对话中。
顺便说一句,我们从许多开发人员那里听说,自己构建是多么困难。 您通常需要计算自己的出价,
您需要设置分块算法。 现在所有这些都已解决。
每个 API 调用不仅仅是检索,您通常还需要重新发送整个对话历史记录,
这意味着设置一个键值存储,这意味着处理上下文窗口、序列化消息等等。
现在,有了这个新的有状态 API,这种复杂性就完全消失了。
仅仅因为 OpenAI 正在管理这个 API,并不意味着它是一个黑匣子。 事实上,您可以看到这些工具正在采取的步骤
就在您的开发人员仪表板内。 在这里,如果我继续点击线程,
这是我相信我们目前正在处理的线程,并且看到,这些是所有步骤,包括功能
被使用正确的参数调用,以及我刚刚上传的 PDF。
让我们继续讨论你们中许多人长期以来一直要求的新功能。 代码解释器现在也可以在 API 中使用,
这使得人工智能能够即时编写和执行代码,甚至生成文件。
让我们看看实际情况。 如果我在这里说:“嘿,我们将成为四个朋友
在这个 Airbnb,我的份额加上我的航班是多少?”
好的。 现在,这里发生的事情是代码解释器注意到它应该编写一些代码
来回答这个问题。 现在它正在计算在巴黎的天数、朋友的数量。
它还在幕后进行一些汇率计算,以便为我们获取传感器。
这不是最复杂的数学,但你明白了。 想象一下您正在构建一个非常复杂的财务应用程序
这需要处理无数的数字,绘制图表,所以实际上任何你通常用代码处理的任务,
那么代码解释器将非常适合您。 好的。 我认为我的巴黎之旅很充实。
回顾一下,我们刚刚看到了如何快速创建一个助手来管理用户对话的状态,
利用知识、检索和代码解释器等外部工具,最后调用您自己的函数来使事情发生
但我还想向您展示另一件事,即使用函数调用与我们的新模式相结合,真正开启可能性
我们今天要推出的。 在 DevDay 工作期间,我构建了一个小型自定义助手
知道关于这个事件的一切,但是今天整天跑来跑去却没有一个聊天界面,
我想,为什么不使用语音呢? 让我们把手机调到屏幕上吧你可以在右边看到它。
惊人的。 在右侧,您可以看到一个非常简单的 Swift 应用程序,它接受麦克风输入。
在左侧,我实际上将显示我的终端日志,以便您可以看到幕后发生的情况。
让我们试一试吧。 嘿,我现在正在主题演讲台上。 您能在开发日向我们的与会者致意吗?
- 大家好,欢迎来到 DevDay。 你们都在这里真是太棒了。 让我们让它成为令人难以置信的一天。
[掌声]
-这不是令人印象深刻吗? 您可以在 API 中选择六种独特且丰富的声音,
每个人都讲多种语言,因此您可以真正找到最适合您的应用程序的语言。
在我左侧的笔记本电脑上,您还可以看到幕后发生的事情的日志。 我正在使用 Whisper 将语音输入转换为文本,
GPT-4 Turbo 的助手,最后是新的 TTS API 让它说话。
由于函数调用,当助手可以连接到互联网并采取行动时,事情变得更加有趣
以实际行动为用户服务。 让我们一起做一些更令人兴奋的事情吧。
这个怎么样? 嘿,助理,您可以在这里随机选择 5 位 DevDay 参与者吗
并给他们 500 美元的 OpenAI 积分? [笑声]
- 是的,正在检查与会者名单。
[笑声]-完成。 我选择了五名 DevDay 参与者并添加了 500 美元的 API 积分
到他们的帐户。 恭喜 Christine M、Jonathan C、Steven G、Luis K 和 Suraj S。
-好吧,如果你认识自己,那就太好了。 恭喜。
就是这样。 今天快速概述新的 Assistants API 以及我们推出的一些新工具和模式,
一切都从为最终用户提供简单的富文本或语音对话开始。
我们真的迫不及待地想看看您建造的东西,并祝贺我们的幸运获奖者。 实际上,
你知道吗? 你们都是这个令人惊叹的 OpenAI 社区的一部分,所以我只想和我的助理谈谈
在我走下舞台之前最后一次。 嘿助理,你真的能给在场的每个人 500 美元吗?
OpenAI 学分? -听起来很棒。 让我来为大家介绍一下。
[鼓掌]-好吧,
该函数将继续运行,但我已经没有时间了。 谢谢大家!谢谢。
祝你有美好的一天。 回到你身边,萨姆。
-很酷吧? [观众欢呼] - 好吧,今天 Assistants API 进入测试阶段,
我们非常高兴看到你们用它做什么,任何人都可以启用它。
随着时间的推移,GPT 和助手成为代理的前身
将能够做更多的事情。 他们将逐渐能够代表您计划和执行更复杂的操作。
正如我之前提到的,我们确实相信逐步迭代部署的重要性。
我们相信人们现在就开始构建和使用这些代理来了解世界将会是什么样子是很重要的,
当他们变得更有能力时。 正如我们一贯所做的那样,我们将根据您的反馈继续更新我们的系统。
我们非常高兴今天能与您分享所有这些。 我们引入了 GPT,
GPT 的自定义版本,结合了指令、扩展知识和操作。
我们推出了 Assistants API,以便您可以更轻松地使用自己的应用程序构建辅助体验。
这是您迈向人工智能代理的第一步,我们将随着时间的推移增强它们的能力。
我们推出了新的 GPT-4 Turbo 模型,它提供了改进的函数调用、知识、更低的价格、新的模式等等。
我们正在深化与微软的合作伙伴关系。 最后,我想花一点时间感谢创造这一切的团队。
OpenAI 拥有惊人的人才密度,但仍然需要大量的努力和协调才能实现这一切。
我坚信我拥有世界上最好的同事。 我非常感激能够与他们一起工作。
我们做这一切是因为我们相信人工智能将成为一场技术和社会革命。
它将在很多方面改变世界,我们很高兴能够致力于为你们所有人提供帮助的事情
为我们所有人建设如此多的东西。 我们之前讨论过如果你为人们提供更好的工具,
他们可以改变世界。 我们相信人工智能将关乎个人赋权和代理
以我们以前从未见过的规模,这也将把人类提升到我们以前从未见过的规模。
我们将能够做得更多、创造更多、拥有更多。 随着智能无处不在,
我们都会按需拥有超能力。 我们很高兴看到你们将利用这项技术做什么
并发现我们将共同构建的新未来。 我们希望你明年能回来。
相对于我们正在忙于为您创建的内容,我们今天推出的内容看起来非常古怪。 感谢您所做的一切。
谢谢你今天来到这里。 [掌声]
[音乐]