未来的数字时代已经来临,随着2024年的到来,人工智能正式迈入数据元年。最近三个月发生了几件大事,除了首个文生视频模型Sora发布、英伟达最强芯片Blackwell GPU发行外,最惹人注目的就是Claude 3大模型的横空出世,全面碾压GPT-4。
今天是亦恺的AIGC创新日,亦恺联合亚马逊云科技将共同探讨Claude 3产品的应用及趋势。亚马逊云科技的Amazon Bedrock 目前是唯一一个提供Claude 3 Sonnet 的托管服务,所以亚马逊云科技对Claude 3 模型的各项优势更为了解,而亦恺作为领先的数据智能服务商,也一直致力于AIGC的技术革命,目前正在积极推进基于序列理解和大语言模型的相关研究。
Claude3是什么
Anthropic目前的评估表明,Claude3模型系列在数学应用题解决(MATH)和多语言数学(MGSM)基准(目前用于大语言模型的关键基准)方面优于同类模型。它主要包含三个模型,Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus。
Haiku 是市场上最快且最具成本效益的模型。它是一种快速紧凑的模型,具有近乎即时的响应能力。
对于绝大多数工作负载,Sonnet 的速度比 Claude 2 和 Claude 2.1 快 2 倍,且智能水平更高。它擅长执行需要快速响应的智能任务,例如知识检索或销售自动化。它在智能和速度之间实现了理想的平衡——对于企业用例是尤其重要的品质。
Opus 是最先进、最强大的基础模型,具有深度推理、高级数学和编码能力,在高度复杂的任务上具有顶级性能。它可以非常流畅地导航开放式提示和新颖场景,包括任务自动化、假设生成以及图表、图形和预测的分析。
Claude3优势
近乎实时响应
Claude 3 具有与其他头部模型相当的复杂视觉功能。它们可以处理各种视觉格式数据,包括照片、图表、图形和技术图表。Anthropic 表示,它们的一些客户 50% 以上的知识库以各种数据格式进行编程,例如 PDF、流程图或演示幻灯片。因此,新模型强大的视觉能力非常有帮助。
更少拒绝回复
以前的 Claude 模型经常做出不必要的拒绝,这表明模型缺乏语境理解。Anthropic 在这一领域取得了有意义的进展:与前几代模型相比,即使用户 prompt 接近系统底线,Opus、Sonnet 和 Haiku 拒绝回答的可能性明显降低。如下所示,Claude 3 模型对请求表现出更细致的理解,能够识别真正的有害 prompt,并且拒绝回答无害 prompt 的频率要少得多。
准确率提升
Anthropic 将答案分为正确答案、错误答案(或幻觉)和不确定性回答,也就是模型不知道答案,而不是提供不正确的信息。与 Claude 2.1 相比,Opus 在这些具有挑战性的开放式问题上的准确性(或正确答案)提高了一倍,同时也减少了错误回答。
Claude3应用
使用Claude3+Bedrock构建智能电商搜索推荐应用
智能电商搜索推荐是利用生成式AI技术为用户提供个性化、高效搜索和推荐服务的创新解决方案,通过结合用户历史数据,购物偏好和搜索记录,给用户提供商品评论分析以及专属化推荐匹配的商品信息等。