每经记者:蔡鼎 每经编辑:兰素英
美西时间3月1日(周三),OpenAI宣布正式推出面向商业用户的ChatGPT和Whisper语音转文字API(application programming interface,中译“应用程序编程接口”),并给出了一系列商业伙伴已经上线的案例。
OpenAI目前允许第三方开发者通过API将ChatGPT集成到其APP和服务中。而通过新的Whisper API,用户也能以极低的价格转录或翻译音频。
ChatGPT成本降低90%
由于全球目前对ChatGPT API的使用需求巨大,这导致去年年底创建的一个未经授权的API违反了OpenAI的服务规则。如今,OpenAI已经推出自己的API来满足需求。据悉,新API的计算将在线下和云设备上进行。
OpenAI表示,其ChatGPT API不仅可以用于创建人工智能驱动的聊天界面,尽管其同时强调几家公司一直在使用它来实现这一目的,包括本周早些时候宣布的Snap的My AI功能。OpenAI表示,全新API基于“gpt-3.5-turbo”模型,其基础是支持ChatGPT的GPT 3.5模型,取代了此前的“text-davinci-003.”。更为重要的是,在去年12月后,公司已经成功将ChatGPT的成本压低了90%。
图片来源:OpenAI官网
OpenAI董事长Greg Brockman表示,“我们需要一段时间才能让这些API达到一定的质量水平。”但Brockman称,“gpt-3.5-turbo”已经在其他方面进行了改进。
“如果你想拥有一个人工智能导师,你肯定不会希望导师只是给学生一个答案。你希望它总是解释,并帮助学生们学习。这就是用户能够构建那种系统的一个例子。我们认为,这将使API可用性更高。”
《每日经济新闻》记者注意到,其实已经有多款商业应用成为ChatGPT API的早期用户。图片和短视频社交平台Snap在本周推出了名为“My AI”的可定制化聊天机器人,供付费订阅用户使用。而拥有6000万学生用户的Quizlet在线学习平台,则提供能出题考验学生的家教机器人。许多中国零售业者出海贸易会用到的Shopify平台,也已经上线了聊天机器人导购。短短几个月内,ChatGPT已经迅速在全球软件生态中觅得自己的位置。
科技媒体theVerge报道称,OpenAI此次提供的模型可能不是微软新版必应搜索引擎正在使用的那种被微软称之为“新的下一代OpenAI大型语言模型”,它比ChatGPT和GPT-3.5“更快、更准确、更强大”。考虑到微软在OpenAI上投入了大量资金,其能够获得普通开发者无法获得的顶尖技术也就不足为奇了。
图片来源:OpenAI官网
据悉,这款名为“gpt-3.5-turbo”的模型,定价为0.002美元/每1000 tokens。这“比我们现有的GPT-3.5模型便宜10倍”,部分原因是“一系列系统范围内的优化”。根据OpenAI官网的解释,token可以理解为一个一个非结构化的单词,而1000个token大概对应750个词。这个价格也要比目前的GPT 3.5模型便宜90%。
据OpenAI官网介绍,举例来讲,“ChatGPT很棒!(ChatGPT is great!)”需要六个token,这个句子的API分别为Chat、G、PT、is、great和!。OpenAI提供了一个工具,用于检查和解释一串文本需要多少标记,并表示一般的经验是,在英语文本中,“一个标记通常对应大约4个字符”。
OpenAI表示,如果开发人员通过该API运行大量数据,他们也可以获得一个专用于ChatGPT的示例。OpenAI的博客文章称,这样做可以让用户更好地控制其使用的模型。
Whisper API支持几十种语言、多种音频格式输入
3月1日,OpenAI还宣布了新的Whisper API,即其语音和文本的模型。OpenAI表示,用户可以用这个模型转录或翻译音频,每分钟花费约0.006美元。
根据OpenAI介绍,Whisper API支持对语音文件进行转录和翻译,并支持包括英语、中文、阿拉伯语、日语、德语、西班牙语等几十种语言,且可以接受M4A、MP3、MP4、MPEG、MPGA、WAV和WEBM格式的输入。不过值得注意的是,OpenAI的产品说明文档中也显示,在业界常用的FLEURS数据集测试中,Whisper large-v2模型在识别英语、意大利语、德语时的单词错误率都能控制在5%以下,但识别中文的错误率达到14.7%。
此外,从技术上讲,Whisper API基于开源Whisper-large-v2模型,因此用户可以在自己的硬件上运行,而无需支付任何费用。此外,OpenAI或还可以访问更为强大的硬件设备,所以当用户正在寻找一个快速的音频转录,或者需要在低功率设备(如手机)上进行转录,那么Whisper API可能是正确的选择。
OpenAI还宣布了一些政策的变化,称这些变化是基于开发者的反馈。其中一个很大的问题,是除非客户明确同意,否则OpenAI将不再使用通过API提交的数据来训练模型。
OpenAI还表示,公司正在努力提高这些语言模型的正常运行时间,其“工程团队现在的首要任务是保持用户使用的稳定性。”
封面图片来源:每经记者 刘雪梅 摄
声明:文章内容和数据仅供参考,不构成投资建议。投资者据此操作,风险自担。
每日经济新闻