北京时间11月7日凌晨,在OpenAI首次开发者大会上,CEO阿尔特曼(Sam Altman)用45分钟的时间公布了过去一年中GPT的各项数据,以及最新版本GPT-4 Turbo的升级功能。正如“Turbo”一词的中文含义“涡轮增压器”一样,本次发布会上,OpenAI的这款最新大模型在长文本、知识库、多模态、模型控制、模型微调、高速率六大方面的功能均进行了“涡轮增压”,而价格甚至比GPT-4还要低。
“今天,有大约200万开发者使用我们的API进行开发,超过92%的财富500强公司使用我们的产品,而ChatGPT的每周活跃用户大约有1亿。”在演讲现场,阿尔特曼不得不制止观众们频频响起的掌声,“你们不用每次都鼓掌,后面的(发布)还有很多。”而在这一切的背后,是OpenAI对自己大模型能力的自信,“随着GPT-4的发布,它仍然是全世界能力最强的大模型。”
在本次大会上,阿尔特曼也显露了OpenAI打造自身生态的野心:通过构建一个大模型版本的“应用商店”(GPTStore),用户可以通过自然语言构建定制化GPT,并将其上传到应用商店获得分成收入,企业也可以在应用商店里挑选最适合自己的大语言模型。
OpenAI官网截图
升级:终于跟上长文本潮流,可输入128k提示词
在演讲伊始,阿尔特曼着重讲述了GPT-4 Turbo在六大方面的升级功能。
贝壳财经记者注意到,长文本输入功能是最近不少国内大模型公司推出的特色功能之一,如10月30日百川智能发布的Baichuan2-192K大模型上下文窗口长度为192K token(语句),号称全球最长(可以直接输入一部《三体》小说),不过这一记录在11月6日被零一万物发布的大模型Yi-34B打破,其将大模型上下文窗口长度刷新到了200K。相比之下,GP4-4的上下文窗口为32K,文字处理量约2.5万字。
而在本次OpenAI的发布中,阿尔特曼将GPT-4 Turbo的上下文窗口提升到了128K,这大约相当于300页纸的文字量。
另一个更新是大模型的知识库,此前GPT-4知识库仅停留在2021年9月,而GPT-4Turbo的内部知识库已更新至2023年4月。值得注意的是,阿尔特曼表示,GPT-4Turbo支持用户上传外部数据库或文件。
多模态能力方面,GPT-4Turbo整合了OpenAI的图像创建模型DALL·E3、新的文本到语音模型TextToSpeech、开源语音识别模型WhisperV3。
而对于大模型在同一问题或连续问题生成答案方面的随机性,阿尔特曼表示,GPT-4Turbo拥有更强的模型控制手段:一是允许一次交互同时调用多个函数,二是引入JSON模式(一种应用程序之间传输数据的方式)以简化API(应用程序接口)调用过程,三是引入seedparameter(种子限制条件)可确保模型返回固定输出。
同时,继8月上线可微调的GPT-3.5Turbo版本,本次开发者可以在GPT-4基础上进行定制化调试训练,OpenAI还表示开放Custommodels(自定义模型)接受企业的模型定制。
最后,阿尔特曼表示,GPT-4Turbo有了更高的速率限制,其开放给API的token吞吐量将提升一整倍。
降价:输入端和输出端都降价
值得注意的是,相比原版GPT-4,GPT-4Turbo的收费做了大幅下降,其输入token的收费价0.01美元,输出token的价格为0.03美元。
同时,GPT-3.5Turbo也得到了升级,新版本GPT-3.5Turbo默认支持16K,价格方面,GPT-3.5Turbo16K输入降价至0.001美元,输出降价至0.002美元,GPT-3.5Turbo微调版本输入降价至0.003美元,输出降价至0.006美元。
此外,据OpenAI公司官网,目前通过GPT-4、GPT-3.5Turbo上传750词的文档分别需要0.06、0.003美元(以最高速度计算)。这次大会上,OpenAI还发布了“有记忆功能”的内存存储AP,可以提高大模型计算速度,降低开发者的API调用成本达95%,同时其还推出了版权保护措施,为使用ChatGPT企业版和开发者平台功能的客户提供法律索赔介入和费用支付保护。
GPT-4Turbo还增加了新的多模态功能,包括视觉、图像创建 (DALL·E 3) 和文本转语音 (TTS)。Turbo版GPT-4 可以接受API中的图像输入,从而实现生成标题、详细分析现实世界图像、以及阅读带有图形的文档等用例。
OpenAI计划为主要的Turbo版GPT-4模型提供视觉支持。视觉输入的定价取决于输入图像的大小。例如,将1080×1080像素的图像发送给Turbo版收费0.00765美元。图像创建方面,OpenAI提供不同的格式和质量选项,每生成一张图像起售价为0.04美元。
平安证券发布研报认为,此次API体系的全线降价将降低用户的使用成本,有利于激发用户基于API的开发热情,推动AIGC技术在应用场景的进一步渗透。
生态:推出应用商店GPTStore,此前插件并不好用
另一个值得注意的事件是,本次发布会上,OpenAI再次梳理了其应用商店体系,引入了GPTs功能,即每个用户都可以通过自然语言构建定制化GPT,并将其上传到应用商店GPTStore获得分成收入。此外,OpenAI还推出了新的开发方式AssistantsAPI(接口助理),提供代码解释器、函数调用等功能,让开发人员可以更轻松地构建自己的辅助AI应用,这些应用可以调用模型和工具实现自己的目标。
这不禁让人想起了今年3月,OpenAI推出的ChatGPT插件功能。该功能刚刚推出时,曾有许多人惊呼大模型成功“联网”,将打开潘多拉魔盒。英伟达AI科学家Jim Fan甚至激动地表示,如果说ChatGPT可以看作苹果手机的出现,那么第三方插件的出现就是苹果应用商店出现了。
不过,在后续的实践中,虽然ChatGPT插件的数量在不断攀升,但这些插件并没有想象中受欢迎,在上个月的开发者会议上,阿尔特曼甚至表示,它们不符合产品市场需求。
平安证券认为,OpenAI引入GPTStore功能、推出AssistantsAPI,与开发者共享收益、优化开发模式,有望加快个性化AIGC应用开发的发展。未来,AIGC技术的进一步渗透与应用场景拓宽值得期待。
随着本次真正的“应用商店”GPTStore的出现,GPT是否会像苹果推出应用商店一样,真正迎来属于自己的繁荣生态?让我们拭目以待。
新京报贝壳财经记者 罗亦丹
编辑 徐超
校对 柳宝庆