大模型卷了一年后之后,今年 OpenAI 发布的节奏明显放缓,但最新的模型已经在路上了。
在最近举行的 KDDI 峰会上,OpenAI 日本公司 CEO Tadao Nagasaki 透露了关于 ChatGPT 下一代模型的最新进展。
Tadao 表示, 代号为「GPT-Next」的新一代模型性能预计将比现有的 GPT-4 模型强大 100 倍,并计划在今年晚些时候发布。
报道称,该模型在 OpenAI 神秘「草莓」模型的一个更小、更紧凑的版本上进行训练。
GPT-Next 模型性能的提升归功于其优化的架构设计和学习效率的改进,而不是单纯依赖于庞大的计算资源。
他还透露,目前 OpenAI 全球员工不足 2000 人,其中约一半专注于 AI 开发。OpenAI 的主要客户包括宣布苹果公司、可口可乐以及生物科技巨头 Moderna。
在演讲中,Tadao 对 GPT 系列的未来进行了展望,他将 GPT-3 与 GPT-4 进行了对比,他表示,与传统软件相比, AI 技术将呈指数级增长。
值得一提的是,据多家外媒报道,OpenAI 正在洽谈新一轮融资,估值预计将超过 1000 亿美元,有望成为全球市值最高的 AI 独角兽。
该轮融资的投资者包括 Thrive Capital、微软、苹果和英伟达等。外媒 The Information 指出,融资期间, OpenAI 或将从非营利组织转变为营利性企业。
另外,最新的数据显示,自去年 11 月份以来,ChatGPT 的周活跃用户数量已经翻了一倍,超过 2 亿。
除了 OpenAI 被传融资消息,最近,OpenAI 前首席科学家 Ilya Sutskever 的新公司 SSI 也官宣从红杉资本和 Andreessen Horowitz 等投资者那里 筹集了 10 亿美元。
SSI 计划利用这笔融资来购买算力并招募一些志同道合的顶尖 AI 人才。
知情人士透露, 尽管这家成立三个月、只有 10 名员工的创业公司尚未推出任何产品,但估值已高达 50 亿美元。
SSI 共有三位联合创始人,除了 Ilya,另外两位联合创始人分别是 Daniel Gross 和 Daniel Levy。其中 Levy 是主要科学家,而 Gross 负责筹款和寻求计算资源。
在官宣创立 SSI 之前,Gross 是一位投资者,也是前苹果公司 AI 部门的负责人,因支持包括 Keen Technologies 在内的一些知名 AI 初创公司而备受关注。Keen 由著名程序员、3D 游戏之父约翰・卡马克创立,旨在开发 AGI。
公开资料显示,Gross 因创办的 Greplin 公司受到赏识而加入 YC。后来,更名为 Cue 的 Greplin 公司在 2013 年以约 4000 万美元的价格被苹果收购。
借此,年仅 23 岁的 Gross 也就成为了苹果的技术总监,主要负责机器学习与搜索业务。
在苹果公司任职期间,Gross 主要负责将机器学习技术融入 iOS 和 macOS 操作系统中,比如从通信记录中智能识别并提取联系人数据,然后将这些数据整合进通讯录等应用之中。
在接受路透社采访时,Gross 曾表示:
对我们来说,找到那些理解、尊重并支持我们使命的投资者至关重要,而我们的使命是直接致力于实现安全的超级智能,尤其是花几年时间对我们的产品进行研发,然后再将其推向市场。
而 Levy 则因在 OpenAI 与 Ilya 共同训练 AI 模型而广受赞誉。
「现在是开展这样一个项目的最佳时机,」Levy 说,「我的愿景与 Ilya 相同:打造一个精干、专注的小团队,致力于实现安全超级智能这一目标。」
与 OpenAI 最初出于 AI 安全考虑而采取的非营利组织不同,SSI 采用了标准的营利性结构。
对于本轮融资,SSI 表示,它计划与云提供商和芯片公司合作,为其计算能力需求提供资金,但尚未决定将与哪些公司合作,而微软、英伟达都是潜在选择。
Ilya 是 Scaling Law 最早一批的忠实拥趸。该定律指出,随着 AI 模型的规模(包括参数数量、训练数据量、计算资源)的扩大,模型的性能和能力也会相应地显著提升。
据路透社报道, Ilya 将以与「前雇主」 OpenAI 不同的方式继续 Scaling ,但并没有透露具体的细节。
「每个人都在谈论 Scaling Hypothesis,但大家都忽略了一个问题:我们究竟在 Scaling 什么?」他说。
有些人可以工作很长时间,但他们只会更快地走上相同的道路。我们并不倾向于这样做。但是,如果你尝试一些不同的方式,那么你就有可能创造一些与众不同的成果。
本文来自微信公众号“APPSO”,作者:发现明日产品的,36氪经授权发布。