xAI继一周前公开宣布其Grok大型语言模型的开源计划之后,又正式推出了更新版本Grok-1.5。
这一新模型不仅优化了长期语境理解能力和高级推理能力,而且对X平台下的Grok用户以及早期测试者开放接入权限。
先来看看Grok-1.5的性能,可以发现其在编码和数学处理任务上的表现尤为突出。在标准化的数学基准测试中,Grok-1.5实现了50.6%的正确率,并且在GSM8K基准测试中达到了90%的得分,明显超越了先前版本的性能。
在HumanEval的基准测试中,更是以74.1%的准确率超过了知名的GPT-4模型,足以表明其具备强大的竞争力。
特别值得注意的是,Grok-1.5新增了对长达128K上下文的处理功能。与之前的版本相比,这一改进允许模型处理的上下文长度增加至原先的16倍,极大增强了模型利用长文档信息的能力。
同时,即使在扩大的上下文窗口中,Grok-1.5依然能维持出色的指令遵循性,并有效处理更长、更复杂的提示。
最后,你们觉得马斯克在AI领域能成功吗?