3月4日晚,Anthropic(著名生成式AI平台)正式在其官网发布了 Claude 3系列的多模态大模型。
Claude注册网址:http://claude.ai
Claude 3 一共设置了三种不同定位的模型,根据能力从弱到强排列分别是Haiku、Sonnet、Opus;
Haiku 的核心竞争力在于其惊人的速度和响应能力,是最轻便迅速的版本。在处理一篇包含 10 万个数据标记的 arXiv 研究论文时,仅需 3 秒便可完成快速阅读和深度理解,其中更包括对复杂图表和图像的精华抽取。因此,Haiku 在处理需求对速度敏感但计算量需求较小的特殊任务上尤为出色。
Sonnet 则代表着在知识检索能力上的极致提升,是最“勤奋”的版本。作为 Claude 2/2.1 的进化版,Sonnet 的速度比之前的版本快了一倍,适用于更多侧重于反应速度的应用场景,如客户支持、销售流程自动化等。而且,Sonnet 并未设置任何使用门槛,开放免费使用,使其为用户带来更佳的效益。
而 Opus 是这个系列中的巅峰之作,在处理复杂任务和大规模数据集时表现出色,适用于需要强大计算能力的场景。它在多个方面—包括研究生水平的专家推理、基础数学、本科水平的科目和编程等十大方向,均超过了知名 AI 模型 OpenAI 的 GPT-4。虽然 Opus 的使用门槛设置在 20 美元,并且 API 的价格是 ChatGPT4 的两倍,但它的强大处理性能和泛用性完全值得这份投资。
以往,Claude 系列模型因其更宏大的上下文窗口(即模型在单次运算中能够处理的信息总量)在业界中备受青睐。当前的新型模型,无论是敏捷的Haiku 还是全面的 Opus,都可以实现对达到 100 万 token 长度的上下文输入的处理,大大领先于原始 GPT-4 的 8k token 的承载能力。然而,这只是冰山一角,Claude 的优势远不止于此。
1、见证卓越的推理能力
Claude 3 在广泛的基准测试中成功超越了 GPT-4 ,尤其在高级认知任务上的表现更是出类拔萃,比如对本科级别专家知识(MMLU)的理解、研究生级别的专家推理(GPQA)以及基础数学(GSM8K)等方面。其中,Opus 模型展现了令人震撼的理解力和流畅表达,其在复杂任务的处理上比任何模型都要出色。
2、极致的视觉处理能力
Claude 3 引入全新的视觉处理功能,能够娴熟处理各种图像格式,比如照片、图表,甚至跨越 PDF、流程图等多样化的图像输出。因此,它在处理需求对视觉信息敏感的任务时,具有不可比拟的优势,特别是那些需将知识库中的信息以各种形式呈现的企业客户的需求。
3、独创的定价策略和无处不在的可访问性
尽管 Claude 3 的定价政策和可访问性不能直接反映模型的技术成就,但Anthropic对其模型的定价展现了对其性能的全面信心。该公司提供了不同版本的模型(比如 Claude 3 Haiku 、Sonnet 和 Opus ),让用户可以依据本身特异的应用需求选出最理想的智能模型,以达到完美均衡速度与成本的平衡。
4、放飞定制化输出的翅膀
Claude 3 能剖析复杂的指令,以结构化的输出格式(例如 JSON )生成结果,使它在自然语言处理的各种任务中游刃有余。这种特征为用户提供了无限的灵活性和应用可能性。
5、谨慎铸造的安全性和透明度
Claude 3 在降低不必要的拒绝率和提高对复杂问题理解准确度方面取得了瞩目的进步。相较于上一代 Claude 2.1 , 新的模型在处理答案开放性挑战的精准度上实现了一次翻倍,将错误回答的数目降到最低。
6、拓展更广的上下文视野
Claude 3 进行一次性运算时,做到了上下文窗口的显著扩展,它能一次处理高达 100 万个 token 的输入。这让模型能更有效地处理长篇文章和信息复杂的流,从长篇文件中准确提取信息成为可能。
中国在大型模型研究领域的探索备受关注。投资人朱啸虎指出:与国外巨头竞争需要巨大的投入成本,但这并不意味着中国在大模型领域没有机会取得突破。这一言论也引发了人们对国内初创公司在大模型研究中的挑战和机遇的思考。
在激烈的人工智能竞争中,国内面临着如何在大模型研究领域实现科技自主的挑战。尽管初创公司面临着资金、人才等方面的压力,但国内拥有本土数据和场景优势,可以通过深入研究特定行业需求,探索定制化的大型模型应用。
国内的科技团队可以通过加强基础研究、强调国家安全、推动产业升级和创新,以及持续投入和国际合作等方式,开拓新的研究方向,实现科技自主。这不仅是商业竞争的需要,更是关乎国家安全和科技发展的战略层面。通过不断创新和勇于探索,中国有望在大型模型研究领域取得更大的突破,确立自身在全球人工智能领域的领先地位。