(图片来源:unsplash)
钛媒体App 8月28日消息,据The information报道,美国人工智能公司OpenAI计划最早在今年秋天推出代号为Strawberry(草莓,之前称为Q*,发音为 Q Star)的全新 AI 模型技术,可能将作为ChatGPT的一部分功能。
报道称,“草莓”模型可以解决它以前从未见过的数学问题(这是当今的聊天机器人无法可靠做到的),并且还经过训练可以解决涉及编程的问题,但它并不局限于回答技术问题。
针对上述消息,OpenAI 发言人未对本文发表评论,此前多家机构曾报道过“草莓”这个名字及其模型信息。
据悉,“草莓”这一模型技术来源于一项基础研究。
几年前,AI 技术先驱、OpenAI联合创始人、时任首席科学家、“ChatGPT之父”伊利亚(llya Sutskever)领导研发了“草莓”的模型技术。在他离开之前,OpenAI 研究人员 Jakub Pachocki 和 Szymon Sidor 在伊利亚的工作基础上开发了一种新的数学求解模型Q*,这让一些专注于 AI 安全的研究人员感到震惊。
而在Q*研发之前,OpenAI 的研究人员开发了一种称为测试时间计算的概念的变体,旨在提高大语言模型的解决问题能力。这种方法让他们有机会花更多时间考虑某人要求模型执行的命令或问题的所有部分。当时,Sutskever 发表了一篇与这项工作相关的博客文章,解释新的大模型技术与人类的比较,即它直接训练模型以产生人类认可的思路链。
去年11月,OpenAI爆发“内讧”风波。当时OpenAI 董事会宣布,罢免奥尔特曼(Sam Altman)的首席执行官职位,这一消息震惊全球科技领域,主要原因是该公司研发了一种Q*大模型技术,几乎与超越人类智力。
今年5月,伊利亚发推文宣布其将离开公司。
“近十年后,我决定离开 OpenAI。公司的发展轨迹堪称奇迹,我相信 OpenAI将在奥尔特曼等人的出色领导下,打造既安全又有益的 AGI。能够与大家共事是我的荣幸,我会非常想念大家。再见,感谢你们所做的一切。我很期待接下来的计划——这个项目对我个人来说意义重大,我会在适当的时候分享细节。”伊利亚后来被披露,离开OpenAI后他创办了另一家对标OpenAI的 AI 实验室。
然而,关于“草莓”Q*引发的 AI 技术发展的猜测并未结束。
本月初,奥尔特曼在推文上发布了一张“草莓”图片,但他没有详细说明,这引发了人们对即将发布“草莓”模型的猜测。据一位直接了解这些会议的人士称,OpenAI 今年夏天还向美国国家安全官员演示了“草莓”。
奥尔特曼在5月份的一次活动中表示:“我们觉得我们拥有足够的数据来开发下一个模型。我们已经进行了各种实验,包括生成合成数据。”
当前,OpenAI需要大量资金支持。
一位知情人士表示,作为与微软达成的商业合作的一部分,OpenAI 自 2019 年以来已从微软筹集了约 130 亿美元,该合作将持续到 2030 年。这位知情人士表示,合作条款可能会发生变化,包括 OpenAI 如何向微软支付租用云服务器的费用以开发其人工智能。云服务器是 OpenAI 最大的成本。
The information报道指,OpenAI 的前景在一定程度上取决于它最终能否推出一款代号为Orion(猎户座)的新旗舰大语言模型。该模型旨在改进其现有的旗舰GPT-4,后者于2023年2月推出。到目前为止,其他竞争对手已经推出了性能与 GPT-4 大致相当的大语言模型。
目前尚不清楚能够提升GPT-4性能的“草莓”版聊天机器人ChatGPT是否足以在今年推出。但这个版本将是原始“草莓”模型的较小、简化版本,称为“蒸馏”版。它力求保持与较大模型相同的性能水平,同时更易于操作且成本更低。
不过,一位知情人士表示,OpenAI 也在使用更大版本的“草莓”模型来生成训练 Orion 的数据。这种由 AI 生成的数据被称为“合成数据”。
这意味着,“草莓”模型可以帮助 OpenAI 克服获取足够高质量数据的限制,从而利用从互联网上提取的文本或图像等现实世界数据来训练新模型。此外,“草莓”模型还可以为即将推出的 OpenAI Agent提供帮助。
商业化层面OpenAI持续加速。报道称,与一年前相比,其向企业销售的大模型和ChatGPT订阅收入增长了约两倍(200%),每月达到2.83亿美元,尽管其每月亏损可能更高。
截至目前,OpenAI公司估值已高达860亿美元(约合人民币6127.84亿元)。
(本文首发于钛媒体App,作者|林志佳)