当前位置:首页|资讯|OpenAI|阿尔特曼|GPT-4|ChatGPT|人工智能

Agent的崛起-对应用场景的理解,将是你用GPT创造价值的基础

作者:虎赳虎叔虎AI发布时间:2023-11-13

北京时间11月7日凌晨2点,在旧金山开启的首届Openai开发者大会上,Sam Altman 在台上和同事,只用 45 分钟时间,就“轰”出了团队最新的成果 GPT-4 Turbo版,相信给众多朋友们已经带来了不小的震撼。

我们这篇内容,主要还是重点聚焦在,这次大会对 ChatGPT 用户影响最大的5个要点,以及对有志于通过人工智能这个领域创造价值变现的人群提出些探讨。

1、 模型升级为 GPT-4 Turbo,六大亮点

第一,更快的响应/更长的上下文。

OpenAI 原本提供的最长的上下文长度为 32k,而此次,GPT-4 Turbo 直接将上下文长度提升至 128k,一举超过了竞争对手 Anthropic 的 100k 上下文长度。

128k 的上下文大概是什么概念?大概约等于 300 页标准大小的书所涵盖的文字量。除了能够容纳更长上下文外,Sam 还表示,新模型还能够在更长的上下文中,保持更连贯和准确。

第二,更好的控制。

OpenAI 为开发者提供了几项更强的控制手段,以更好地进行 API 和函数调用。比如,在 GPT-4 Turbo 模型下,Dalle 绘画将保持更强的一致性

首先,新模型提供了一个 JSON Mode,可以保证模型以特定 JSON 方式提供回答,调用 API 时也更加方便。

另外,新模型还允许同时调用多个函数,同时引入了 seed parameter,在需要的时候,可以确保模型能够返回固定输出。接下来几周,模型还将增加新功能,让开发者能看到 log probs。

第三,模型内部和外部知识库的升级。

ChatGPT 的知识库更新到了 2023 年 4 月。过于陈旧的数据库(之前截止到2022年1月),一直让 ChatGPT 饱受诟病。Sam Altman 承诺未来还将继续更新其知识库,不使其落伍。更新的数据,代表着更前沿的资料,对于需要做学术、调研、趋势预测等等的朋友来说,更新的数据库能节省大量的数据检索时间。

除了内部知识库的升级,GPT-4 Turbo 也升级了外部知识库的更新方式,现在可以上传外部数据库或文件,来为 GPT-4 Turbo 提供外部知识库的支持。

第四,多模态成为 GPT 的内置功能。

新模型可调用DALL-E、Whisper等其他AI模型。

GPT-4 Turbo 现在可以以图生图了。同时,在图像问题上,目前 OpenAI 推出了防止滥用的安全系统。OpenAI 还表示,它将为所有客户提供牵涉到的版权问题的法律费用。

在语音系统中,OpenAI 表示,目前的语音模型远超市场上的同类,并宣布了开源语音识别模型 Whisper V3。

第五,模型微调与定制。

8 月,OpenAI 曾经发布过 GPT-3.5 Turbo 的微调服务。当时,有早期测试表明,经过微调的 GPT-3.5 Turbo 版本在某些任务中甚至可以超越 GPT-4,不过定价相对较高。

而此次,Sam 宣布 GPT-3.5 Turbo 16k 的版本目前也可以进行微调的定制了,且价格将比前一代更低。

同时,OpenAI 也开始接受单个企业的模型定制了。「包括修改模型训练过程的每一步,进行额外的特定领域的预训练,针对特定领域的后训练等等。」Sam 表示。同时他表示,OpenAI 没有办法做很多这样的模型定制,而且价格不会便宜。那些试图搞大模型定制化创业公司前景堪忧。

第六,是更高的速率限制。

GPT-4 用户,发布会后马上可以享受到每分钟的速率限制翻倍的体验。同时,如果不够满意,还可以进一步通过 API 账户,申请进一步提升速率限制。

 

2、API 体系的全线降价。

此次新发布的 GPT-4 Turbo,输入方面比 GPT-4 降价 3 倍,而输出方面降价 2 倍,OpenAI 表示,总体使用上降价大概 2.75 倍。

新模型的价格是每千输入 token 1 美分,而每千输出 token 3 美分。降价的 API 迎来了现场开发者的欢呼。

Sam 还表示,在优先解决价格之后,下一个重点解决的问题将是速度问题,很快,开发者们就会发现 GPT-4 Turbo 将变快很多。

3、用户自定义GPT

按照 Sam Altman 的说法,每一个 GPT 像是 ChatGPT 的一个为了特殊目的而做出的定制版本。

为了突出新的 GPT 应用,ChatGPT 整个页面将有小幅度的调整。左上角除了 ChatGPT,下面的应用,就是此次推出的 GPT 应用。

Sam 表示,创建者还可以进一步为 GPT 增加 action(动作)。

创建一个这样的 GPT,本质上,用户能够定制的功能其实并不多:指令(预设的 prompt),外设的知识库和动作。但是,能把三者丝滑地结合起来,让一个不懂代码的人也能更简单地创建应用。

演示案例:

演示中,OpenAI 的 Jessica Shay,就利用了 Zapier 链接了自己的日历和手机短信,通过与 Zapier 这个应用聊天的方式,直接安排了自己的日程,并通知了同事。

比如作为一个拥有货运价格表的代理,可以将文件上传到 OpenAI 后,一键部署出自己的询价助理,这样简洁丝滑的应用部署,在之前还并不存在。而如果发布最终能够得到用户认可的话,类似的应用也将能够填充 OpenAI 的应用商店,对于普通人来说,有可能一个定制 GPT就能带来不菲的收益。

4、Assistants API

此次 OpenAI 也推出了让开发者更容易使用 OpenAI API 的开发方式——Assistants API。可以帮助开发者构建在自己的应用程序中构建Agent。

通过 Assistants API,OpenAI 客户可以构建一个具有特定指令、利用外部知识并可以调用 OpenAI 生成式 AI 模型和工具来执行任务的「助手」。像这样的案例范围包含,从基于自然语言的数据分析应用程序到编码助手,甚至是人工智能驱动的假期规划器。

Assistants API和GPTs 都是openAI 向Agent商业化迈出的第一步。给大模型提供了长期记忆,调用工具和执行代码的能力。

5、GPTs 商店即将上线

对于 ChatGPT 用户而言,这一次发布会最重磅的更新,当属 GPTs 商店。

早在 5 月,OpenAI 就开放了插件系统,首批就上线了 70 个大模型相关的应用,领域包括猜词、翻译、查找股票数据等等。但插件系统却远远没有达到苹果应用商店的影响力。

预计将在 11月下旬推出 GPTs 商店的同时,Sam Altman 表示这个 GPT 定制入口将向所有 ChatGPT 使用者放开。并且,还将推出排行榜、付费等模块。

人人都能通过自然语言创建基于自己的知识库的 AI Agent,加入 OpenAI 的应用商店,让用户可分享ChatGPT的用法,只要你定制的 GPT角色有足够多的人使用,或者付费,作为创作者就能从中赚取收益。

在这里每个GPT都是定制版的ChatGPT。整个构建自定义GPT的过程也都是通过自然语言对话的形式。

每个定制化的GPT都包含了指令Instructions、拓展知识(Expanded knowledge)和Actions这三要素。OpenAI已将插件发展为GPT的自定义操作(即Actions),所以后续提到的Action就是之前的插件。

 

对应用场景的理解,将是你用GPT创造价值的基础:

总体来说,这次Openai的开发者大会,个人觉得大可分为了两大块:

一个是Openai又强大了,强大到提供了众多新的功能和便利给到我们这些使用者和二次开发的创作者。

 

另一块就是告知我们,可以借助Openai所提供的这些功能和便利,通过我们自身对各自生活、工作领域各类场景的理解,发挥各自的想象力和创造力,在这平台上创造出更细分领域的可分享使用的用户自定义GPT,并可以从中分享获利。

 

由于很多复杂的环节已经由平台及各种插件实现了,从而使得我们实现这些想法做法变得更简单,门槛更低。同时也导致不少新型的,涉足到套壳的、做技术二次开发的公司的存在感瞬间降低了不少。OpenAI 一定程度上威胁到了很多其他做大模型的厂家,和做Agent的公司。

不恰当的比喻,现在的OpenAI好像某些游戏厂商,什么MOD火,咱就做个相似DLC赚钱。

目前似乎就剩下应用层面的开发和自定义Tool。应用层面定然出现百花齐放的盛况,也是机会最多的。每个应用的开发者都应该思考如何GPT+,思考如何让GPT让应用变更更智能,比如演示中日历+GPT,催动手机短信发送。未来会有越来越多的有趣的应用搭载GPT,创作更多高层级智能。如果硬件设备搭载GPT,机械智能也是近在眼前。想必OpenAI会与更多硬件公司进行合作。

 

如果要把 AI 落到真正可用的场景里,是需要熟悉业务场景的人的。而且需要各行各业熟悉各自业务领域的人。这些事情,OpenAI 目前还做不到。所以,他要做 UGC,通过平台提供的功能,让更多的用户,来自不同场景的使用者,在平台上自行开发适用于其场景的可借助ChatGPT来实现的工作流。

相信我们国内的大厂也是有这类想法和做法了的。

那么作为我们普通人(指非开发者),可以借助这些大模型提供的功能,根据特定的自己所熟悉领域的一些场景,开发出一些实用的更有效率的工作流程,这是一个可以为自己、也为社会创造价值的一种方式。

理解用户的需求场景是设计产品的基础和出发点。

产品设计需要立足于解决具体的用户痛点和需求,而不是仅仅从技术出发。技术只是实现目标的手段,最核心的是要弄清用户真正的需求是什么。

具体来说,理解需求场景可以从以下几个方面着手:

  1. 用户研究:通过观察、访谈、调研等方式,深入理解目标用户的生活、工作情况,发现他们的真实困难和诉求。

  2. 数据分析:利用可用的用户数据,分析用户行为模式,找到需求的症结所在。

  3. 竞品分析:研究现有竞争产品的优缺点,找出他们未能满足的用户需求。

  4. 痛点发掘:根据上述研究,提取出用户最迫切和值得解决的痛点,这才是产品要着力的方向。

  5. 需求整理:根据发现的痛点和需求,进行分类整理,找到设计产品的设计核心目标。

只有做到这几步,确定核心需求,产品设计和技术实现才会有的放矢。同时,在整个设计过程中,都要不断与用户验证,调整产品以达到最佳的用户体验。

总之,用户导向的设计思想非常重要。理解需求场景是一项持续的工作,需要同步跟进用户需求的变化。这样设计出的产品和技术才会有价值。



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1