当前位置:首页|资讯|ChatGPT|OpenAI

动动嘴就能定制ChatGPT,赚分成!OpenAI要做大开发者生态 | 新榜出品

作者:新榜发布时间:2023-11-28

原标题:动动嘴就能定制ChatGPT,赚分成!OpenAI要做大开发者生态 | 新榜出品

作者 | 卷毛

编辑 | 张洁

今天凌晨(北京时间11月7日),“AI春晚”首届OpenAI开发者大会如约而至,此前的爆料基本都被证实了,要围绕GPT-4做大生态,进一步降低开发门槛。面对这一波升级更新,从业者兴奋不已,也有人调侃道“Sam Altman是真不给自己活路”。

来看看OpenAI开发者大会的亮点总结:

Sam Altman首先回顾了过去一年的成绩单:目前ChatGPT的每周活跃用户数已达到1亿,约有200万开发者基于OpenAI API进行开发,92%的财富500强公司在使用OpenAI的产品。

OpenAI这次发布了数十项更新,主要包括:

发布GPT-4 Turbo模型,功能更强大、更便宜,并且支持128K上下文窗口。
发布Assistants API,使开发者更轻松地构建自己的辅助AI应用程序,获得类似Agent的体验。
API更新多模态功能,包括带视觉功能的GPT-4 Turbo、图像创建 (DALL·E 3) 和文本转语音 (TTS)。

使用Assistants API无需代码即可创建高质量助手

OpenAI还降低了许多模型API的价格,新发布的GPT-4 Turbo输入价格(每1000个tokens)比GPT-4便宜3倍,为0.01美元,输出便宜2倍,为0.03美元。

对于更多用户,尤其是没有编程基础的开发者,OpenAI这次推出了ChatGPT的自定义版本,称为GPTs。无需编码,人人都能在对话中创建一个自己的GPT,并公开分享给其他人使用。OpenAI将在本月推出GPT商店,展示最佳、使用量最大的GPT,并和这些创建者进行收入分成。

图源OpenAI官方博客(https://openai.com/blog/introducing-gpts)

关于隐私和安全问题,OpenAI建立了新的审查系统,企业客户可以部署仅供内部使用的GPT,OpenAI不会使用API或ChatGPT企业客户的数据进行训练。

图源OpenAI官方博客(https://openai.com/enterprise)

更多细节可以查看以下直播视频,“头号AI玩家”结合AI翻译整理了整场演讲全文,欢迎收藏、转发和讨论!

回顾过去一年OpenAI的发展

Sam Altman:

早上好。欢迎来到我们的第一个OpenAI开发者日。我们很高兴你来到这里,这里的氛围很棒。

欢迎来到旧金山。从第一天开始,旧金山就是我们的家。这座城市对我们和整个科技行业都很重要。我们期待着在这里继续成长。所以今天我们有一些很重要的事情要宣布。

但首先,我想花点时间谈谈我们在过去一年里所做的一些事情。大约一年前,11月30日,我们发布了一个研究预览ChatGPT,后来到三月份进行得相当顺利。我们随后推出了GPT-4,它仍然是世界上性能最出色的模型。

在过去的几个月里,我们推出了语音和视觉功能,ChatGPT现在可以看到并说话。

最近,我们推出了世界上最先进的图像模型DALL·E 3。当然,你可以在ChatGPT中使用它。

对于企业客户,我们推出了ChatGPT企业版,提供企业级安全和隐私,更高速度的GPT-4访问,更长的上下文窗口等等。

今天,我们有大约200万开发人员基于我们的API开发各种用例,做出了令人惊叹的事情。超过92%的500强公司使用我们的产品。现在我们有大约1亿用户每周活跃在ChatGPT上。令人难以置信的是,我们是完全通过口口相传实现的。人们只是发现它很有用,并告诉他们的朋友,OpenAI是目前世界上最先进和使用最广泛的AI平台。

但数字永远无法说明全貌。真正重要的是人们如何使用产品,人们如何使用AI。所以我想给你们看一个简短的视频。

(长约2分钟的用户案例视频,分享了ChatGPT帮助用户写信表达情感,作为创业者的工作助手,帮助艺术创作者获得设计灵感,帮助医生做研究,完成日常生活任务,帮助程序员编写代码,帮助老人获得陪伴等等)

我们喜欢听人们如何使用这项技术的故事。这就是我们做这一切的原因。

发布GPT-4 Turbo

现在让我们来看看新的东西。首先,我们将讨论我们所做的一系列改进,然后再谈谈我们下一步的发展方向。

在过去的一年里,我们花了很多时间与世界各地的开发者进行交流,听到了很多反馈。今天我们要向你们展示一款新模型GPT-4 Turbo。

GPT-4 Turbo将解决许多你们的需求。我们提供了六个方面的更新。

第一,上下文长度。很多人的任务需要更长的上下文长度,GPT-4最多支持8k,在某些情况下,支持32k。但我们知道这对你们中的许多人来说还不够。

现在GPT-4 Turbo最多支持128000个上下文tokens。这就是一本标准书的300页,比我们的8k上下文长16倍。除了更长的上下文长度之外,该模型在更长的上下文中会更准确。

第二,更多控制。我们了解到开发人员需要对模型、响应和输出有更多的控制。所以我们已经用多种方式解决了这个问题。

我们推出了一个叫做Json模式的新功能,确保模型使用有效的Json进行响应。这是一个巨大的开发者需求,它将使调用API变得更容易。

该模型在函数调用方面也做得更好,你现在可以同时调用许多函数,而且它在遵循一般指示方面会表现更好。

我们还将引入一项新功能,称为可重复输出。您可以输入一个种子参数,它将使模型返回一致的输出。当然,这可以让你对模型行为有更高程度的控制。今天我们推出了测试版,在未来几周,我们还将推出一项功能让你可以查看API中的日志问题。

第三,更了解世界。你希望这些模型能够更好地获取关于世界的知识,我们也是。所以我们的平台支持检索功能,你可以将外部文档或数据库中的知识引入到你正在构建的任何东西中。

我们也在更新知识界限。GPT-4关于世界的知识截至2021年。我们将尽力不再让它过时。GPT-4 Turbo现在拥有截至2023年4月的世界知识。随着时间的推移,我们将继续改进这一点。

第四,新模态。DALLE 3,带有视觉的GPT-4 Turbo,和新的语音文本模型,都将提供API。

我们有一些客户刚刚开始使用DALLE 3以编程方式生成图像和设计。可口可乐正在推出一项活动,让消费者使用DALLE 3生成卡片。当然,我们的安全系统可以帮助开发者保护应用程序不被滥用。

这些工具在API中可用,GPT-4 Turbo现在可以通过API接受图像作为输入,可以生成标题、分类和分析。例如,Be My Eyes使用这项技术来帮助盲人或低视力的人完成日常任务,像是识别面前的产品。

使用我们新的TTS模型,你可以从API中的文本生成非常自然的声音,并有6种预设声音可供选择。

举个例子,你知道著名的发明家亚历山大·格雷厄姆·贝尔对声音的世界着迷吗?他用聪明才智发明了留声机,使声音穿越时间,这比我们听到的其他任何东西都要自然得多。

语音可以使应用程序更自然地交互,更易于访问。我们还解锁了许多用例,如语言学习和语音助手。

说到新模式,我们将发布新版本的开源语音识别模型Whisper V3,今天很快就会在API上推出,它提高了跨多种语言的性能,希望你会喜欢它。

第五,定制化。自从几个月前推出GPT 3.5以来,微调模型一直非常有效。从今天开始,我们将扩展到16k版本的模型。同时,即日起我们将邀请活跃的微调用户申请GPT-4微调实验项目。

微调API非常适合让模型在数据量相对较小的各种应用程序中实现更好的性能。但是你可能需要一个模型来学习全新的知识领域或使用大量专有数据。所以今天我们将推出一个名为自定义模型的新程序。

我们的研究人员将帮助客户创建出色的自定义模型。这包括模型训练中的每个步骤,进行额外的特定领域预训练或训练后的过程。它是为特定领域量身定制的。

我们刚开始无法和很多公司达成合作。这将需要大量的工作,而且为了达到预期,至少在初期阶段它不会很便宜。但如果你很想把事情推进到极致,请与我们联系,我们可以一起做得很好。

第六,更高的速率限制。我们为所有GPT-4用户每分钟增加一倍的tokens,以便做更多事情。而且你可以申请更改速率限制,并直接在API帐户设置中引用。

除了这些速率限制,我们还必须尽力保证开发者在我们的平台上成功构建。因此,我们引入了版权保护,这意味着如果你面临有关版权侵权的法律索赔,我们将介入并保护你,并支付所产生的费用。这适用于ChatGPT企业客户和API开发者。

需要强调的是,我们不会使用API或ChatGPT企业客户的数据进行训练。

实际上还有一个开发者的需求大于所有这些需求,那就是GPT-4的定价。

GPT-4 Turbo是行业领先的模型,它提供了我们刚刚所说的许多新功能,而且比GPT-4更智能。我们从开发人员那里听说他们有很多想要构建的东西,但是GPT-4的成本太高了,如果我们能将成本降低20至25%,那就太好了。

我很激动地告诉大家,GPT-4 Turbo,一个更好的模型,但比GPT-4便宜得多,从今天起输入token价格降低3倍,输出token价格降低2倍。因此新的价格为每千个输入token 1美分,每千个输出token3美分。这意味着GPT-4 Turbo的费率比GPT-4便宜2.75倍以上。

我们优先考虑了价格,在价格和速度中我们必须选择其中一个,但很快你会注意到GPT-4 Turbo变得更快了。

我们也在降低GPT-3.5 Turbo 16k的成本。输入token减少了三倍,alpha token减少了两倍,这意味着GPT-3.5 16K现在比以前的GPT-3.5 4k型号便宜,运行微调GPT-3.5 Turbo 16K版本也比旧的微调4k版本便宜。

与微软CEO对话

我们刚刚介绍了很多关于模型本身的内容,希望这些更新能解决你的问题。我们很幸运有一位对合作伙伴对实现这些起到了重要作用。这位特别嘉宾是微软首席执行官Satya Nadella。

Sam Altman:两个问题不会占用你太多时间,微软目前是如何看待这一合作关系的?

Satya Nadella:我记得你第一次联系我说,嘿,你有Azure积分吗?从那时起,我们已经走了很长一段路,你们创造了一个神奇的世界。在合作方面,首先是这些工作负载,我从事基础设施业务已有三十年了,从来没见过这样的工作量和工作模式,这些训练工作是如此同步,如此庞大。所以我们一直在做的第一件事就是与你们合作构建系统,Azure的形态发生了巨大的变化,以支持正在构建的模型,然后将最好的模型提供给开发人员。

另一方面,我们自己就是开发者,正在打造产品。在我第一次看到GPT上的Copilot时,我对这一代基础模型的信念完全改变了,所以我们想在OpenAI API之上构建我们的Copilot。

例如,GitHub Copilot可以作为企业版提供给这里的所有与会者,开发人员甚至还可以通过Azure Marketplace构建产品以快速进入市场。

Sam Altman:您如何看待未来的合作关系或人工智能的未来等等?

Satya Nadella:有几件事我认为非常关键。 一是我刚刚描述的系统,我们将继续致力于让基础模型的建设者拥有最好的训练和推理系统,拥有最多的计算能力,向前迈进。

我们双方都关心的第二件事是使命,我们的使命是帮助地球上的每个人和每个组织取得更大成就。归根结底,人工智能只有真正发挥作用时才会有用,我认为能将人工智能的好处广泛传播给每个人,这是我们的目标。

最后一件事,我们坚信安全很重要,安全并不是以后才会关心的事情,我们非常关注这一点。

发布GPTs

本次开发者大会,我们对ChatGPT也进行了一些更新。ChatGPT现在可以使用GPT-4 Turbo与所有最新的改进,包括最新的知识获取,我们将继续更新。

ChatGPT现在可以在需要编写和运行代码时浏览网络、分析数据、生成图像等等。你们反馈说模型选择器非常烦人,所以它已经去掉了。从今天开始,你将不需要在下拉菜单中点击来回切换。这一切将无缝协作。ChatGPT知道何时使用何种能力。

但这并不是主要的事情,定价也不是。实际上开发者还有另一个更大的需求。

我们知道人们想要人工智能更智能、更个性化、更可定制,可以为您做更多事情。最终,你只需告诉计算机你需要什么,它就会为你完成所有任务。这些功能在人工智能领域经常被称为代理Agent。

OpenAI坚信,渐进式、迭代式部署是解决人工智能安全问题和安全挑战的最佳方式。我们认为,谨慎地迈向Agent的未来尤为重要。这需要大量的技术工作和社会的深思熟虑。因此,今天,我们迈出了未来的第一步。我们很高兴推出GPTs。

GPTs是针对特定目的定制的ChatGPT版本。你可以用于任何带有说明、扩展知识和操作的内容构建一个GPT,一个自定义的ChatGPT,然后你可以将它发布以供其他人使用。

GPTs结合了指令、扩展知识和操作,可以为你提供更多帮助,使你更轻松地完成各种任务或享受更多乐趣。

你可以直接在ChatGPT 中使用GPTs。实际上,只需通过与 GPT 交谈即可用语言对其进行编程,可以轻松自定义行为,使其满足需求。构建一个GPT变得非常容易,它为每个人提供了代理。

我们将向你展示什么是GPTs、如何使用它们以及如何构建它们。然后我们将讨论如何分布和发现它们,以及对于开发人员,我们将展示如何将这些类似代理的体验构建到自己的应用程序中。

首先,让我们看几个例子。

我们在code.org的合作伙伴正努力在学校推广计算机科学,他们的课程被全世界数千万学生使用。code.org精心制作了Lesson Planner GPT,以帮助教师为中学生提供更具吸引力的体验。

如果老师要求它以创造性的方式解释4个循环,它通过视频游戏角色反复拾取硬币来解释,对于八年级学生来说非常容易理解。

接下来,Canva建立了一个GPT,让你可以通过用自然语言描述设计想要的东西。如果你说为今天晚上的开发者招待会制作一张海报,并且给它一些细节,它会通过点击画布api生成一些选项。

有些人可能对这个概念很熟悉,我们已将插件迭代为GPTs的自定义操作。你可以继续和它聊天,看看不同的装饰,然后选择喜欢的进入Canva来获得完整的设计体验。

现在我们要给大家直播演示GPT。Zapier构建了一个GPT,可以跨6000个应用程序执行操作,以释放各种集成的可能性。我们请Jessica,我们的解决方案架构师之一,来进行这个演示。

Jessica:

首先,GBTs位于左上角。单击 Zapier AI,在右侧,可以看到这是我今天的日程表,它实际上已经连接到我的日历了。我可以询问今天的日程安排。

我们在构建GPTs时考虑到了安全性,因此,在执行任何操作或共享数据之前,它会请求你的许可。GBTs旨在接收你的指令,决定调用哪个功能来执行该操作。我要求它识别我的行程上的冲突,可以看到它实际上能够识别这一点。

那么如果我想让Sam知道我必须提前离开怎么办?我要切换到我和Sam的对话,然后我会说是的,请运行它。

Sam Altman:

除此之外,人们正在创建更多类型的GPT,更多 GPTs将很快出现。

我们知道许多想要构建GPT 的人不知道如何编码。现在你只需通过对话即可构建GPT,自然语言将成为人们未来使用计算机的重要组成部分。

举个例子,我要创建一个 GPT,在启动新项目时为创始人和开发人员提供建议。

进入GPT构建器,首先关于商业创意,我问GPT是否能给我一些建议。GPT问我想要做什么,我说我想帮助初创公司创始人思考他们的业务、商业理念,并在创始人获得一些建议后提供进一步的建议,比如关于为什么不能发展得更快。

GPT会开始思考这个问题,它写了一些详细的说明。它还会问我起什么名字,创业导师怎么样?挺好的,当然,我也可以叫它别的名字。

在预览模式的右侧,可以看到它已经开始创建GPT,其中说明了它的作用,提供了候选问题。

我上传了一些关于初创企业讲座的记录,要求它针对这些问题提出建议。在“配置”选项页面,你可以看到已经启用的功能,可以添加自定义操作。比如我要求GPT给出简洁和建设性的反馈。

我现在只向我自己发布这个GPT。但我稍后可以添加更多有用的操作,通过链接公开分享,供任何人使用。或者,企业客户可以专门为公司制作GPT。

本月晚些时候,我们将推出GPT 商店。我们将推荐最好和最受欢迎的GPT。 当然,我们会确保商店里的GPT在可供访问之前遵循我们的政策。

同时,我们将向那些构建最有用和最常用的 GPT 的人,支付我们收入的一部分。

我们很高兴能通过GPT 商店来培育一个充满活力的生态系统。这只是我们周末构建起来的,相信之后将会有很多很棒的GPTs。

发布Assistants API

作为一个开发者大会,我们还将把相同的概念引入API。

许多人已经在API 上构建了类似代理的体验,例如Shopify、Discord、MyAI的AI工具。这些经验很棒,但构建起来却很困难,有时需要花费数月时间,需要数十名工程师组成的团队。 因此,今天我们通过新的辅助 API 让这一切变得更加容易。

AssistantsAPI 包括持久线程,因此它们不必弄清楚如何处理内置于检索代码解释器(沙箱环境中的工作 Python 解释器)中的长对话历史。当然,还有我们之前讨论过的改进的函数调用。

我们邀请Ramon,我们的开发者体验主管,向你展示其工作原理。

Ramon:

今天,我们在API 中推出新模式。想象一下我正在为全球探险家构建Wonderlust旅行应用程序。这是登陆页面。我实际上已经使用GPT-4 来提出这些目的地想法,这些插图是使用DALLE 3 API以编程方式生成的。

让我们添加一个非常简单的助手来发布这个应用程序。首先,切换到新的Assistants Playground。只需给它一个名称、一些初始说明和一个模型就能创建了。我选择了GPT-4 Turbo,然后打开代码解释器,检索和保存。这样我们的助理已经准备好了。让我们快速浏览一下代码。

对于每个新用户,我都会创建一个新线程。当这些用户与他们的助手互动时,我会将他们的消息添加到线程中,然后我可以随时运行助手响应流回应用程序。这样我们就可以返回应用程序并尝试实际操作。

如果我说我们去巴黎吧,只需几行代码,就可以在应用程序内获得非常专业的帮助。

我最喜欢的功能之一是函数调用,它可以保证Json输出没有编辑延迟,并且可以一次同时调用多个函数。

如果我继续问在巴黎最重要的10件事是什么,助手给出了回答,还在右侧的地图上显示出地点。这种集成使我们的自然语言界面能够与应用程序商店的组件和功能流畅地交互。

我们还有检索功能,为助手提供除这些即时用户消息之外的更多知识。比如我已经预订了去巴黎的机票,我只需把机票PDF拖放到这里,助手就可以读取这些文件,提取关键信息。

许多开发人员说自己构建很困难,通常需要计算嵌入,设置分块算法。现在,所有这些都已为你处理好。不仅仅是检索,像处理上下文窗口、清理消息等这种复杂性现在完全被新的API消除了。

但这不意味着它是一个黑匣子。事实上,您可以在开发人员仪表板中看到这些工具正在执行的步骤。

接下来一项新功能也被要求很久了,代码解释器现在也可以在API中使用了。AI能够即时编写和执行代码,甚至生成文件。 那么让我们看看它的实际效果。

如果我说将会有四个朋友入住此AirBnb,我要花多少钱,再加上我的航班。它编写了一些代码来回答这个问题,它计算了我在巴黎的天数,还在幕后做了一些汇率计算来得到这个答案。

我想我的巴黎之行已经安排好了。回顾一下,我们刚刚了解了如何快速创建一个助手来管理用户对话的状态,利用这些外部工具,如知识、检索和代码解释器,最后调用您自己的函数来实现。

我们还有另一个案例展示了使用函数调用的可能性。

在为聋人日工作时我们建立了一个小型的定制助手,它了解有关该活动的一切。这是我的手机页面,在右侧,你可以看到一个非常简单的快速应用程序,它接受麦克风输入。API 中有六种独特而丰富的声音可供选择,每种声音都支持多种语言,因此你可以找到最适合的声音。

在左侧可以看到幕后的日志,我用Whisper把语音输入转换成文本,用GPP-4 Turbo的助手,最后用新的TTS API让它说话。

当助手可以连接到互联网并对用户做出反应时,函数调用会变得更加有趣。我们让助手在这里随机选择五名与会者并给他们500 美元的OpenAI积分。可以看到,助手正在检查与会者名单,完成后,我挑选了五位开发日参与者,并向他们的帐户添加了 500 美元的积分。

总结

Sam Altman:

非常酷,今天Assistants API 开放测试版,我们非常高兴看到你们用它做什么。之后任何人都可以启用。GPTs和Assistants是Agent能够做更多事情的前身,他们可以逐渐代表你计划和执行更复杂的操作。

正如我之前提到的,我们确实相信逐步迭代部署的重要性。我们认为,人们现在就开始构建和使用这些代理非常重要,这样可以了解当他们变得更有能力时世界将会是什么样子。我们将根据你的反馈继续更新我们的系统。

今天我们推出了ChatGPT的GPT自定义版本,它结合了指令、扩展知识和操作。我们推出了Assistants API,以便你更轻松地使用自己的应用程序构建辅助体验。这是我们迈向人工智能代理的第一步,随着时间的推移,它们的能力将不断增强。

我们推出了新的GPT-4 Turbo模型,提供了改进的函数调用知识、更低的价格、新的模式等等。

我们正在深化与微软的合作关系。

最后,我想花一点时间感谢创造这一切的团队。OpenAI的人才密度非常高,但要实现这一切,仍然需要大量的努力和协调。我非常感激能够与他们一起工作。我们做这一切是因为我们相信人工智能将成为一场技术和社会革命,它将在很多方面改变世界。

我们之前说过,如果你给人们更好的工具,他们就能改变世界。人工智能将以我们以前从未见过的规模赋予个人权力和代理权,并将把人类提升到我们以前从未见过的规模。我们将能够做得更多,创造更多,拥有更多。

随着智能无处不在,我们都将拥有随需应变的超能力。很高兴看到你们将利用这项技术做些什么,去共同构建新的未来。希望你们明年能再来。感谢。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1