在人工智能的快速发展中,大模型技术已成为全球科技竞争的焦点。
10月16日,继上半年千亿参数模型 Yi-Large 之后,时隔五个月,零一万物发布了最新的旗舰模型Yi-Lightning(闪电),中国大模型中首度超越 GPT-4o。
Lighting直译为闪电,从命名可以看出,本来应该是说新模型的推理速度进一步提升。但零一万物这次,也确实做了个“闪电奇袭”!
国产大模型首超GPT-4o
在国际权威盲测榜单 LMSYS 上,Yi-Lightning 超越了超越了OpenAI的GPT-4o和 Anthropic 的 Claude 3.5 Sonnet,排名世界第六,中国第一,实现了历史性的突破。
图注:国际权威盲测榜单LMSYS 中,大语言模型综合能力排名
值得关注的是,“Yi-Lightning”的评分几乎与马斯克最新推出的 xAI 模型 Grok-2-08-13持平,并大幅领先于 GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18以及 Claude3.5Sonnet 等其他竞争对手。
这也意味着零一万物紧随 OpenAI、Google 之后,与xAI 打平,进击全球前三大模型企业。
值得一提是,这次Yi-Lightning大举杀出重围,Lmsys团队更是特意发帖子,称这是竞技场上的大新闻:
这一成就不仅展示了零一万物在AI大模型领域的技术实力,也为中国AI的发展注入了强心剂。Yi-Lightning模型的推理速度和生成质量都有了显著提升,首包时间减少了一半,最高生成速度提升了近四成,展现了“极速”特点。
零一万物的这一成就,是在公司坚持“模基共建”战略,即模型训练、AI基础设施和AI应用三大团队的协同合作下取得的。
这种模式使得零一万物能够在保持模型性能的同时,大幅降低推理成本,使得Yi-Lightning模型的API价格降至每百万token仅需0.14美元(0.99元人民币),直逼行业最低价,相比之下GPT-4o的成本为4.40美元,为开发者和企业客户提供了极具性价比的选择。
中美大模型差距缩短至五个月
在商业化方面,零一万物也展示了其清晰的战略布局。
公司不仅在ToC端有所布局,还在ToB端推出了AI 2.0数字人解决方案,聚焦零售和电商等场景,通过Yi-Lightning模型的加持,提升了数字人的实时互动效果和话术生成的准确性。
此外,零一万物还计划在近期发布更多的ToB解决方案,包括AI Infra解决方案和私有化定制模型等,进一步拓展其在企业级市场的服务能力。
今年6月,零一万物创始人李开复博士在《格隆博士会客厅》的访谈中,彼时也分享了他对中美大模型差距的最新见解。他分析,中国大模型与美国顶级大模型之间的差距已经从之前的7至10年迅速缩短至仅有六个月。
更令人振奋的是,通过技术创新和优化,零一万物最新旗舰模型Yi-Lightning已将这一差距进一步缩减至五个月。李开复强调,这一成就标志着中国在AI领域的巨大潜力和快速进步,展现了中国科研团队的才能和决心。
他坚信,尽管未来可能会有新的挑战,例如OpenAI等公司推出新模型版本可能会再次影响竞争格局,但零一万物将继续坚持预训练模型的工作,不断推动中国AI技术向前发展,缩小与国际领先水平的差距。
在AI大模型的竞赛中,零一万物的Yi-Lightning模型不仅在性能上取得了突破,还在成本控制上展现了优势。
这得益于公司在模型架构上的创新,如采用MoE混合专家模型架构,以及在训练过程中采用的多阶段训练方法和混合注意力机制。这些技术的应用,使得Yi-Lightning在处理长序列数据时能够保持高性能,同时降低计算成本。
辟谣“掉队”传闻
近来,有市场消息称,被称为“AI六小虎”的6家中国大模型初创企业月之暗面、百川智能、智谱AI、Minimax、零一万物、阶跃星辰,其中有2家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用,而零一万物就是其中一家。
几日前,李开复先是在在朋友圈进行了辟谣,他表示零一万物一直在做预训练,去年和今年发布的Yi-34B、Yi-Coder,Yi-VL等都是发布时全球第一梯队。
此次发布会上,李开复也公开辟谣称,零一万物绝不会放弃预训练模型工作。
其回应称,预训练既是技术活也是费钱的事儿,但据他了解,目前“AI六小虎”做预训练仍不成问题。
“这6家公司融资额度都是够的,我们做预训练production run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的6家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。”