作者 | 周愚
编辑 | 邓咏仪
美国时间8月9日,Anthropic正式发布了结合Claude 2开发的Claude Instant 1.2版本。上月11日,这家由OpenAI前高管创立的人工智能企业刚刚发布了全新的AI模型Claude 2。
据Anthropic介绍,Claude是该公司最先进的高性能模型,而Claude Instant则是一个更轻量、便宜、快速的选择。
按照用户输入(Prompt)和模型输出(Completion)计费,Claude Instant每百万token的价格分别为1.63美元和5.51美元,仅为Claude 2的约六分之一。
Claude Instant和Claude 2功能、价格对比。来源:Anthropic
与Claude 2相同,Claude Instant 1.2也能提供高达10万token的上下文窗口。这意味着,该模型可以一次性分析大约75000个单词,几乎是目前商业可用模型中“记性”最好的——能够记住更多近期对话的内容。
得益于Claude 2的优势,Claude Instant 1.2在数学、编码、推理等领域,也都展示出比上一代更好的表现。
在Codex P@1(Python编程测试)中,Claude Instant的得分从1.1的52.8%上升到了1.2的58.7%,不过和Claude 2的71.2%仍有一段距离。而在GSM8K(小学数学问题测试)中,Claude Instant 1.2的得分则大幅提升至86.7%,直逼Claude 2的88.0%。
来源:Anthropic
Anthropic还称,Claude Instant 1.2能“生成更长、更结构化的回答,并且更好地遵循格式说明”“在引用提取、多语言功能和问题回答方面均有所提升”。
值得一提的是,在安全方面,Claude Instant 1.2甚至有着比Claude 2更优异的表现,在Anthropic进行的自动红队评估中得分最低。
同时,该模型产生的“幻觉”更少,对“越狱”的抵抗力更强,Anthropic将其归功于,该公司使用的“宪法AI”和人类反馈方法。
在AI大模型中,“幻觉”是指生成与训练数据不匹配的结果,“越狱”则是指通过某些手段绕过模型设置的安全功能的技术。
Claude各版本模型的安全评估,分数越低,表现越佳。来源:Anthropic
与Claude达成合作的企业,可以通过Anthropic提供的API访问最新版本的Claude Instant 1.2。公司声称目前已经拥有“成千上万”的客户和与作伙伴,其中包括Quora、DuckDuckGo等。
据悉,Anthropic成立于2021年,由OpenAI前研究副总裁达里奥·阿莫代伊担任CEO。迄今为止,该公司已完成融资14.5亿美元,估值达到数十亿美元。
不过,Anthropic还表示,未来两年内公司继续研发大模型,还需要约50亿美元。