马斯克的xAI连发两款新模型，有进步但还谈不上领先

作者：36氪的朋友们发布时间：2024-08-15

“Grok的进度是火箭。”马斯克如此兴奋地在X上宣布Grok-2的到来。

当地时间8月14日，xAI发布了Grok-2和Grok-2mini两款AI模型的测试版。其中，Grok-2是该公司推理能力最强的语言模型，而轻量化模型Grok-2mini则是Grok-2的“兄弟产品”，试图实现小参数体型下的强功能。

xAI在博客文章中表示，Grok-2的早期预览版相较于Grok-1.5有了重大进步，具有聊天、编码和推理方面的前沿功能。

该公司声称，Grok-2的早期版本以“sus-column-r”的名称进行测试，在LMSYS排行榜上的表现优于Anthropic公司的Claude 3.5 Sonnet和OpenAI的GPT-4-Turbo。LMSYS排行榜通过在大语言模型间进行随机匿名的一对一“对战”，并基于ELO评级系统得出排名。

图源：xAI

sus-column-r（Grok 2早期版本）现已公开，凭借超过12000个社区投票，sus-column-r在总体排行榜上获得了第3名，与GPT-4o相当。它在编码获得第2名、困难提示获得第4名，数学方面也取得第2名。

xAI还通过AI导师系统测试Grok与新的模型互动表现，Grok-2重点评估模型在两个关键领域的能力：遵循指示和提供准确、真实的信息。Grok-2在推理检索到的内容和工具使用能力方面表现出显著进步，例如正确识别缺失信息、通过事件序列进行推理以及丢弃不相关的帖子。

此外，xAI通过一系列学术基准对Grok-2模型进行了评估，这些基准包括推理、阅读理解、数学、科学和编码。该公司表示，“在研究生水平的科学知识、常识和数学竞赛问题等领域的表现可与其他前沿模型相媲美。”

马斯克正在将xAI与其收购的社交媒体“X”深度绑定——Grok-2和Grok-2mini将对X的增强搜索功能、深入了解帖子以及改进回复功能提供支持，尽管此前xAI曾因使用X用户数据进行训练而遭致反对。

此次更新的一大亮点是，Grok-2模型可以在X上生成图像，其生图模型使用了近期大火的 Flux.1模型，但目前仅限于X上的Premium和Premium+用户。

由于Grok的图像生成功能没有任何限制，已经有不少用户借此进行政治人物图像创作，例如有用户利用Grok-2生成美国首任总统华盛顿的图片，该帖子还被马斯克转载。然而，OpenAI的ChatGPT会拒绝生成这类图像，避免政治风险。

图源：X

值得注意的是，Grok-2和Grok-2mini目前仍处于测试阶段。该公司预计，本月晚些时候将通过其企业API向开发人员提供这两种模型。即将推出的API建立在新的定制技术堆栈上，允许多区域推理部署，以实现全球低延迟访问，同时提供增强安全功能，例如强制性多因素身份验证、流量统计数据和高级计费分析。

在与OpenAI分道扬镳后，马斯克曾预测2029年将会实现通用人工智能，而他所创办的xAI最终目标是让消费者、企业甚至所有人都可以使用AI产品，并变成有用的工具。其希望通过AI去帮助人们解决复杂的科学和数学问题，并且“理解”宇宙。

xAI的动作也在不断加速。该公司于2024年1月进行了首次融资，金额为1.35亿美元；5月完成了60亿美元的B轮融资，公司估值也从此前的180亿美元飙升至250亿美元，成为美国又一家AI独角兽。

到了7月，马斯克表示，xAI团队已经开始在“孟菲斯超级集群”上进行训练。该集群由10万个液冷H100 GPU组成，目标是在今年12月前训练出“按每项指标衡量都是世界上最强大的人工智能”。

他的野心还不止于此，曾透露xAI计划打造一台超级计算机“算力的超级工厂”，预计规模是市场上最强大竞争对手的四倍。

作为大模型的“后来者”，马斯克认为xAI可以在人工智能领域带来新的突破和创新，同时强调竞争有利于推动整个行业的进步，避免形成一家公司在人工智能领域占主导地位的单极世界。

但从其最新发布的两款模型来看，并未表现出超越行业的创新性，仍处于追赶者的角色。Grok-2要想在与OpenAI、谷歌等一众科技公司的竞争中突围，需拿出更强有力的产品才行。

本文来自“界面新闻”，记者：陈振芳，编辑：宋佳楠，36氪经授权发布。

马斯克的xAI连发两款新模型，有进步但还谈不上领先

推荐体验

相关资讯

不提AIGC，谈不上游戏变革

马斯克版ChatGPT背后开发工具上线！xAI产品两连发，网友：交付速度太疯狂

马斯克新成立的xAI公司前景如何？

马斯克的「xAI」计划

马斯克的xAI发布首款产品！有一点 ChatGPT比不上，特斯拉还能用

近期资讯

深圳安易控取得电芯堆叠组件专利，能在电池包超出预应力范围时进行二次固定

在抖音上换内容与风格的探索与实践指南

太阳的神奇世界：生命之源与可再生能源的未来探索

上海西艾爱电子取得具有一体化微动开关的直流接触器专利，提高产品制造工艺装配的稳定性

江苏国科智能取得一种侧进风储能电池架专利，控制进风流量保证储能电池稳定运行

江西安驰取得一种分体式构造箱体专利，提升使用安全性

蜂巢能源取得电池模组专利，提高电池包中不同电池模组的一致性

如何在微信中有效刷步数并保持健康生活方式

如何关闭智能设备的省电模式以提升性能体验

选择与使用音响的全方位指南：提升你的听觉体验与生活品质

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响