比o1 mini性能更强,价格更低,性价比新王o3-mini再次引爆AI圈热议。
在官方截图中,中等o3-mini的性能和o1 mini差不多,价格却只有后者的一半,整体延迟也和GPT-4o相当。
最主要的,这表明了OpenAI可以在降低成本的同时提高性能。
与此同时,o3-mini背后团队也曝光了,其中华人更是占据了绝对焦点。
而且我们还发现了一件有意思的事:
包括o3-mini在内,有3位华人(任鸿宇、赵盛佳、Kevin Lu)几乎结成了固定搭子,还一起负责过之前的GPT-4o mini/o1 mini。
这第1位,就是曾在OpenAI最后一天直播中现身的北大校友任泓宇,当时由他来展示o3-mini的编程能力。
任泓宇去年刚加入OpenAI担任研究科学家,主要负责语言模型训练,是GPT-4o的核心开发者、GPT-Next项目组成员。
他博士毕业于斯坦福大学。加入OpenAI之前,在Apple、Google、NVIDIA和Microsoft均有大量研究实习经历。
然后是赵盛佳(Shengjia Zhao),OpenAI研究科学家,方向为ChatGPT的训练和对齐。
他于2022年加入OpenAI,博士毕业于斯坦福大学计算机科学系,本科毕业于清华大学。
第3位是Kevin Lu,大概今年7月加入OpenAI。
他2021年毕业于加州大学伯克利分校,就读期间受伯克利人工智能研究所(BAIR)联合主任Pieter Abbeel和谷歌DeepMind研究科学家Igor Mordatch指导,方向为强化学习和序列建模。
除了上面这几位mini搭子,经任泓宇透露,o3-mini还有下面这几位成员:
Max Schwarzer,去年11月加入OpenAI,主要负责提高ML系统的能力。
加入OpenAI之前,曾在谷歌Brain和DeepMind实习,还在Mila人工智能研究所(由深度学习图灵奖得主Yoshua Bengio领导)研究强化学习和自监督学习。
Eric Anthony Mitchell,在OpenAI主要负责o系列模型研究。
本科毕业于普林斯顿大学,博士毕业于斯坦福大学计算机科学系(方向为语言模型)。
他在DeepMind有过一段4个月的暑期实习,更早前是三星AI中心(Base纽约)的一名研究工程师。
Brian (Qiang) Zhang,南开校友,今年3月加入OpenAI负责模型API研究。
他硕士毕业于加州大学洛杉矶分校。加入OpenAI之前,在支付公司Stripe(目前是Chatgpt支付服务商)工作了近7年。
Ted Sanders,拥有OpenAI 3年工龄的老员工,主要负责GPT后训练。
博士毕业于斯坦福大学。加入OpenAI之前,在Netflix研究推荐算法,更早之前在两家咨询公司供职。
在OpenAI下一代模型o3系列发布后,CEO奥特曼曾表示:
在许多编码任务中,o3-mini将比o1大幅降低成本。
官方介绍中,o3-mini支持低中高三种思考程度设置。
在代码能力中,低设置下o3-mini和o1-mini差不多,中高设置已经超过了o1正式版。
目前o3-mini仅提供有限测试申请,预计明年1月底左右推出,完整o3还要更久。
不过如果等不及了,也可以自己去加速加速进程(doge)。
这不,o3-mini团队成员赵盛佳就放出了一则招聘消息,邀请共商预训练前沿模型/成本与性能兼具模型的大计。
参考链接:
[1]https://x.com/ren_hongyu/status/1870208580135100750
[2]https://x.com/shengjia_zhao/status/1870177990111580399
本文来自微信公众号“量子位”,作者:一水,36氪经授权发布。