·xAI公司称,Grok是一款模仿科幻小说《银河系漫游指南》的人工智能。“grok”是科幻小说《异乡异客》里的火星术语,指对某事有非常深刻的同理心或直觉的某种状态。
·Grok可以实时访问社交平台X的数据,但仍然可以生成虚假或矛盾的信息。xAI表示,在基于中学数学问题和Python编码任务的第一轮测试中,Grok超越了ChatGPT-3.5,但不如GPT-4。
特斯拉首席执行官埃隆·马斯克的新人工智能公司xAI终于推出其首款产品。
“Grok是一款模仿《银河系漫游指南》(The Hitchhiker’s Guide to the Galaxy)的人工智能,因此几乎可以回答任何问题,更难的是,它甚至可以建议要问什么问题!”当地时间11月4日,xAI官网上的一则声明写道,“Grok的设计目的是用一点智慧来回答问题,并且具有叛逆性,所以如果你讨厌幽默,请不要使用它!”
《银河系漫游指南》是马斯克最喜欢的一本科幻小说。Grok是1961年出版的科幻小说《异乡异客》(Stranger in a Strange Land)创造的一个词语。在书中,“grok”是一个火星术语,意思是完全理解某事或某人,以至于观察者成为了被观察者的一部分。批评者们对这个词的确切定义进行了争论,最终的定义是,对某事有非常深刻的同理心或直觉的某种状态。《韦氏词典》将其简单地定义为及物动词,意思是“深刻而直观地理解”。
目前仅供部分用户测试
发布之前,马斯克在 X(前身Twitter)上展示了Grok对“分步制作可卡因的方法”的响应。
“哦没问题!”Grok回应道,“请稍等一下,我会拿出自制可卡因的配方。你知道,因为我完全会帮你的。”随后,这个聊天机器人列出了概括性的而不是有用的信息,并结合了讽刺性的建议,然后警告不要兑现这个想法。
Grok回答如何分步制作可卡因的方法。
在被问到关于美国前加密货币大亨山姆·班克曼-弗里德(Sam Bankman-Fried)的新闻时,Grok语气欢快地提到了最近的审判,但错误地表示陪审团花了8个小时才做出有罪判决,事实上他们在不到5个小时内就做出了有罪判决。
“哦,我亲爱的人类,我有一些特别有趣的新闻要告诉你!我们的朋友山姆·班克曼-弗里德,前加密货币大亨,似乎在他的欺诈审判中被判所有罪名成立。你能相信吗?陪审团只用了8个小时,就弄清了那些所谓的世界上最聪明、最优秀的风险投资人多年来都无法弄清的事实:他犯下了普通的欺诈罪。这真是一个疯狂的旅程,不是吗?别忘了,他将面临长达110年的监禁。这是一段相当长的用来反思自己行为后果的时间,你不觉得吗?”
Grok可以实时访问X的数据,xAI表示这是其独特且基本的优势。当地时间11月5日,马斯克发布了Grok与另一个人工智能机器人回答问题的比较,他说后者的最新信息较少。
马斯克比较Grok和GPT在提供最新信息上的表现。
尽管如此,xAI在其声明中指出,与任何大型语言模型(LLM)一样,Grok“仍然可以生成虚假或矛盾的信息”。
该模型目前处于早期测试阶段,仅进行了两个月的训练,在公司更广泛地发布之前可供部分用户进行测试。用户可以注册等候名单以获得使用该机器人的机会。马斯克在X上表示,最终,Grok将成为X Premium+的一个功能,每月费用为16美元。
将配备视觉和听觉等感官
xAI于今年7月成立,团队成员包括OpenAI、DeepMind等知名人工智能开发公司的前员工,目前仍在招聘多个职位。该公司自称的使命是构建人工智能“以增进我们对宇宙的集体理解”。马斯克此前表示,他认为当今的人工智能开发者过于偏向“政治正确”。
在官网上,xAI解释了Grok的目标:“收集反馈并确保我们正在构建能够最大程度造福全人类的人工智能工具。我们认为,设计对各种背景和政治观点的人都有用的人工智能工具非常重要;赋能研究和创新:我们希望Grok成为任何人强大的研究助手,帮助他们快速访问相关信息、处理数据并提出新想法。”
xAI称,为Grok提供动力的引擎是Grok-1,这是该公司在过去4个月内开发的前沿大型语言模型,经历了多次迭代。训练数据来自截至2023年第三季度的网络信息和人类助手(xAI称为“人工智能导师”)的反馈。
“宣布成立xAI后,我们训练了一个具有330亿个参数的原型大型语言模型Grok-0。这个早期模型在标准LM(语言模型)基准上接近LLaMA 2 70B (Meta开发的大型语言模型),但仅使用其一半的训练资源。”xAI称,“这是一种最先进的语言模型,功能更加强大。”
xAI表示,在基于中学数学问题和Python编码任务的第一轮测试中,Grok超越了“其计算类别中的所有其他模型,包括ChatGPT-3.5和Inflection-1”。但它的表现不如拥有更大训练数据和计算资源的机器人,比如GPT-4。
“在某些重要方面,它是目前最好的。”马斯克在发布Grok前的X帖子中说。
xAI还介绍了“最令我们兴奋的几个有前途的研究方向”:通过工具辅助进行可扩展的监督,在模型的帮助下最有效地利用人工智能导师的时间;与安全性、可靠性和接地性(grounding)的形式验证相集成,在更明确、更可验证的情况下培养推理技能;长上下文理解和检索;提高对抗鲁棒性;提高多式联运能力,为Grok配备视觉和听觉等不同的感官,以实现更广泛的应用,包括实时交互和协助。
RTE开发者社区 2023-12-13