当前位置:首页|资讯|AI大模型|人工智能

AI大模型专题:Claude3大模型发布,人工智能发展持续演绎(附下载)

作者:AIGC学派发布时间:2024-03-08

原标题:AI大模型专题:Claude3大模型发布,人工智能发展持续演绎(附下载)

今天分享的是AI系列深度研究报告:《AI大模型专题:Claude3大模型发布,人工智能发展持续演绎》。

(报告出品方:国联证券)

报告共计:16

海量/完整电子版/报告下载方式:公众号《人工智能学派》

Claude3 大模型发布,人工智能发展持续演绎

Anthropic 推出新一代大模型,多项指标引领行业。 3 月 5 日,Anthropic 发布新一代 AI 大模型系列-Claude 3。该系列模型包 含三个,按能力排名从弱到强排名分别为:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。Claude3 Opus 在多项评测基准中均超过了 GPT4 和 Gemini 1.0 Ultra,在多个领域中展现较强计算能力,推动人工智能 大模型行业基准进一步提升。

Claude3 模型不同版本应对不同运用场景。 Opus 现阶段是 Anthropic 最智能的模型,在多项常见 AI 系统评测中均优 于市场上其他模型。Opus 对于复杂问题的理解和处理展现出了近乎人类的水平,引领了通用智能领域的最前沿。Haiku 在智能领域里是最快以及最具 成本效益的模型,在同等智能水平下,该模型更智能、快速、经济实惠。对于多数工作,Sonnet 智能水平更高,处理工作速度比 Claude2 和 Claude2.1 快 2 倍以上,与同水平的模型相比,更加经济实惠、适合大规模部署场景。

多项测评表现优异,强信息追溯能力或展现自主意识。 Anthropic 在法学院入学考试(LSAT)、多州律师考试(MBE)、美国数学竞赛 2023 年数学竞赛和研究生入学考试 (GRE) 普通考试中评估了 Claude 3 系列模型,测试结果均明显优于其他模型。Claude3 Opus 不仅实现了近乎 完美的寻找定位能力,超过了 99%的准确率。在某些特定情况下,它甚至识别除了关于此前评估的局限性,意识到“针”语句(目标语句)是人为插入到原始文本中的。

强大的视觉能力与拟人化能力 Claude3 模型具有与其他头部模型相媲美的复杂视觉功能。它可以处理一系列的视觉数据,包含照片、图表、图形、和技术图表。Anthropic 表示, 他们的一些客户 50%以上的数据以不同的数据格式进行编程,例如 PDF、 流程图或演示幻灯片。Anthropic 除了在写作、编码、长文档问答、非英语对话和指令遵循等核心任务取得较大改进。同时还使用模型在金融、法律、 医学、STEM 和哲学领域进行了测试,可以发现 Claude Sonnet 在 60%-80% 的情况下更受青睐。

算力、模型、应用三条主线 相关公司包括:(1)国产算力基础设施:海光信息、寒武纪-U、中科曙光、 浪潮信息、紫光股份、锐捷网络等;(2)AI 模型商业化:百度、科大讯飞、 商汤、拓尔思等;(3)AI 应用:①音视频:万兴科技、海康威视、大华股 份等;②图像:美图公司、虹软科技等;③办公:金山办公、福昕软件、泛 微网络、用友网络等;④垂直领域:同花顺、恒生电子、宇信科技、中科 软、卫宁健康、医渡科技、中科创达等。

Claude3 系列模型多项指标引领行业

Cladue3 系列模型多项指标超越竞品

3 月 5 日,Anthropic 发布新一代 AI 大模型系列-Claude 3。该系列模型包含三个,按能力排名从弱到强排名分别为:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。Claude3 Opus 在多项评测基准中均超过了 GPT-4 和 Gemini 1.0 Ultra,在 多个领域中展现较强计算能力,从而推动了人工智能大模型行业标准进一步提升。

新智能行业标准

Opus 现阶段是 Anthropic 最智能的模型,在多项常见 AI 系统评测中均优于市场上其他模型(如本科生水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等)。所有的 Claude3 模型展示了杰出的能力在分析预测、细节内容创作、代码生成和非英语语言翻译领域。Opus 对于复杂问题的理解和处理展现出了近乎人类的水平,引领了通用智能领域的最前沿。

几乎实时处理结果 Haiku 在智能领域里是最快以及最具成本效益的模型,它可以在不到三秒内阅读 完一篇在 arXiv 平台上包含密集图表与图形的文章。对于多数工作,Sonnet 智能水平更高,处理工作速度比 Claude2 和 Claude2.1 快 2 倍以上。它擅长需要快速回应的任务,例如知识检索或销售自动化。Opus 的处理速度与 Claude2 和 2.1 版本相似, 但智能水平更高。

强大的视觉能力 Claude3 模型具有与其他头部模型相媲美的复杂视觉功能。它可以处理一系列的视觉数据,包含照片、图表、图形、和技术图表。Anthropic 表示,他们的一些客户 50%以上的数据以不同的数据格式进行编程,例如 PDF、流程图或演示幻灯片。

强溯源能力或展现自主意识

更少的拒绝回复 以前的 Claude 模型由于缺乏上下文语境的理解,经常做出不必要的拒绝。 Anthropic 在这领域取得了有意义的进展:与前几代模型相比,即使用户给出的提示接近系统的设定边界,Opus、Sonnet 和 Haiku 拒绝回答的可能性明显降低。Claude 3 模型对于需求表现出更细致的理解,可以识别有害指示,并且降低了拒绝回答无害指示的频率。

报告共计:16页

海量/完整电子版/报告下载方式:公众号《人工智能学派》


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1