当前位置:首页|资讯|Claude|ChatGPT

超大规模预训练的语言模型-Claude-2-100k介绍

作者:翻译技术点津发布时间:2024-01-19

01 Claude系列介绍

Claude是Anthropic发布的一款超大规模预训练的语言模型。

2023年3月15日,Anthropic发布了一款类似ChatGPT的产品Claude,只对企业开放试用,支持在Slack平台上使用。

2023年7月11日,Anthropic宣布独立发布Claude 2。升级之后,Claude 2的处理能力提升到了100K个Token,这意味着它可以处理数百页的技术文档,甚至是整本书。此外,Claude 2 也开始面向更广泛的用户群体免费开放,并支持中文使用。

2023年11月22日,Anthropic发布最新版本Claude 2.1,已经支持200k Token的上下文,不过只对API用户开放。


02 使用途径

(1)Claude官网:

科学上网登陆https://claude.ai需要国外手机号来注册账号。

(2)Poe官网:

登陆Poe官网,利用搜索栏检索Claude,能够显示出Claude-2-100k、Claude-instant和Claude-instant-100k三款聊天机器人。


图1 Poe官网Claude搜索界面

其中Claude-instant和Claude-instant-100k可免费使用,Claude-2-100k需要订阅Poe会员才能使用。


图2 Poe会员订阅界面

在订阅Poe后,即可使用Claude-2-100k机器人。


图3 Claude-2-100k使用界面


03 产品亮点

Claude-2-100k是Anthropic的最强大模型,支持高达100k Token(约75,000个词)的上下文窗口,尤其擅长处理和翻译长文本。Claude-2-100k上传文件支持PDF、Docx、TXT、CSV、MD、ini等格式文件。

(1)长文本概括

用户可以上传长文本文档,或者将长文本直接复制粘贴到Claude-2-20k中进行处理,省去了先进行分段再逐段处理的麻烦。

(1)总结概括Yuval Noah Harari的小说Sapiens: A Brief History of Humankind《人类简史》。


图4 长文本概括示例1

(2)对知网学术论文进行观点的提炼和总结。


图5 长文本概括示例2


(2)长文本翻译

尽管Claude-2-100k支持100k Token,但在翻译实践中的单次输出能力远不及100k。为了更好达成翻译目标,可以根据文本长度,适当切分文章,并给出相应提示,让Claude-2-100k继续翻译。

(1)以翻译J.K.罗琳创作的长篇小说《哈利·波特与火焰杯》的第一章节为例。


图6 长文本翻译示例1

(2)以下内容选自国际货币基金组织在2023年10月发布的《世界经济展望》中的第一章《全球前景与政策》,总结概括后翻译成中文,共48页。


图7 长文本翻译示例2


(3)英汉翻译能力

升级后的Claude 2在中文能力方面有了显著提升,翻译准确性和流畅性提高。

(1)以下示例为文学翻译,选自艾米莉·勃朗特的诗歌Love and Friendship。


图8 英汉翻译示例1原文


图9 英汉翻译示例1译文

(2)非文学翻译,选自联合国教科文组织有关儿童教育的报告。


图10英汉翻译示例2


04 与ChatGPT在翻译领域的比较

作为ChatGPT的最强竞品,Claude 2的综合实力虽不及GPT4,但可以和GPT3.5较量一番。

表 Claude2 与GPT3.5和GPT4的对比


从翻译领域来讲,Claude-2-100k拥有更强大的记忆能力,能够概括、总结和翻译更长文本,但是GPT4在处理同等且适量的翻译任务时,反应速度更快,翻译质量更高。

(1)英汉翻译

对比文学翻译,以艾米莉·勃朗特的诗歌 Love and Friendship为例。GPT4快速生成了符合要求的五言诗,而Claude-2-100k反应较为迟缓,并且无法理解五言诗的含义。


图11 GPT-4英汉翻译示例



图12 Claude-2-100k英汉翻译示例

(2)汉英翻译

对比文学翻译,以中国的宋明理学为例。可以看出Claude-2-100k版语言表达更简洁,而GPT4版更正式专业。


图13 Claude-2-100k汉英翻译示例


图14 GPT-4汉英翻译示例

(3)译文赏析

在制定相同的赏析标准时,Claude-2-100k的回答较为简单且片面,而GPT-4的回答更为专业且全面。(注:译文1为GPT4版本,译文2为Claude-2-100k版本)


图15 Claude-2-100k译文赏析示例


图16 GPT-4 译文赏析示例

总结:在处理复杂的长文本时,推荐使用Claude-2-100k,能够节省时间,提升效率。但是在翻译长度较短的文本时,ChatGPT的英汉互译和译文赏析能力更为出色。


05 与CNKI AI在学术研究领域的比较

CNKI AI学术研究助手,提供问答式增强检索和生成式知识服务,支持单篇问答、文章伴读、专题问答和全库问答。


图17 CNKI AI线上邀请测试通道

Claude-2-100k与CNKI AI的对比从以下四个方面展开:

(1)单篇问答

以上文提及的知网论文为例,对比Claude-2-100k和CNKI AI在单篇论文问答方面的能力:

Claude-2-100k根据论文原有结构概括总结,逻辑清晰、简明扼要。


图18 Claude-2-100k论文总结

CNKI AI并没有按照原文结构进行总结,并且遗漏了一些要点,表现劣于Claude-2-100k。


图19 CNKI AI论文总结

(2)文章伴读

在精读文献时,CNKI AI可以随时选择概念解释、中英互译、相关文献搜索、引用问答、复制等伴读服务,而Claude-2-100k仅支持对话问答。


图20 CNKI AI精读论文

(3)专题问答

在总结分析多篇论文时,Claude-2-100k表现出色,按照文章顺序依次分析提炼了摘要、研究方法和研究结论。


图21 Claude-2-100k专题总结

CNKI AI的专题问答功能还不健全,在论文识别上还存在很大问题。它并没有按照上传的论文顺序分析,并且生成了五篇论文以外的内容,存在自行编撰信息的问题。


图22 CNKI AI专题总结

(4)全库问答

在CNKI AI的问答式增强检索栏中输入“机器翻译”,能够自动生成概念解析和相关文章,十分便捷。


图23 CNKI AI问答式增强检索

Claude-2-100k需要用户手动输入相关提示词,才能生成想要的内容。


图24 Claude-2-100k信息检索

(注:案例中Claude-2-100k生成的相关论文并非真实文献)

总结:CNKI AI在研究学术文献、检索专有名词和查找相关论文等方面十分便捷,整体页面简洁,功能多样。但是CNKI AI主推的四项功能还有待改进,其对信息的提取和总结能力以及反应速度都逊色于Claude-2-100k。

特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。

- END -

原创来源:北外CAT课程展示-罗邵雯-2023

推文编辑:罗邵


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1