所有人都在期待能打败ChatGPT的产品,但或许不会是另一个ChatGPT。
出品 | 微果酱(wjam123456)
作者 | 陈出木
当ChatGPT大杀四方,而国内类似的AI产品还没有足够成熟的消息传来时,出现了一个全新AI助手产品——Claude(官网链接:https://www.anthropic.com/product)。
Claude的背景很强悍,来自前OpenAI员工独立门户后在2021年建立的公司Anthropic,2022年融资超7亿美元,今年年初还让谷歌投了近4亿。同时,Claude的噱头也被大家架上了高位,诸如“ChatGPT的最强竞品”“GPT杀手”,对标ChatGPT的意味十足。
那么,Claude的表现究竟如何?
01#
Claude好用吗?
相比ChatGPT在注册环节就把不少人拦了下来,Claude的注册流程稍稍简单一些。因为Claude其实是内嵌在企业聊天工具Slack(https://slack.com/get-started#/createnew)中的,可以通过用谷歌邮箱注册后者账号来直接体验Claude。
注册之后,在弹出的网页最后一行链接中点击“创建一个新的工作区”。
按照指引创建成功会显示“Success”,即可进入工作区,在左边栏的“应用”中搜索添加Claude。
到这一步,我们就可以开始体验Claude了。
面对Claude用英语打的招呼,果酱妹用中文要求它自我介绍。Claude非常顺畅地转为中文回复,并不需要做其他设置。
我的名字叫Claude,我是一款人工智能助手。我会说中文和英文,能帮助用户回答问题并完成简单的任务。我不是任何一家公司的产品,我的创始人搭建了我这个平台,让我可以和用户进行交互。很高兴认识你!
点击Claude的回复还可以进行回复、转发、保存、提醒等,有点像微信消息中点击右键弹出的操作框。
出于新媒体人的本能,果酱妹首先向Claude询问了今天中文互联网有什么热点,Claude非常有条理地列出了五个热点话题,并对其做了简单说明。
看似非常“聪明”,但经过果酱妹的核实,发现是一个都不能信。且不说给出的资讯都不是发生在今天,Claude回答的错误之处还在于事件内容本身,如品牌名称压根不存在,比赛双方及比分数都不正确。
于是,在果酱妹指出错误之后,Claude迅速道歉,虚心反省自己,直言自己存在时空混淆的问题。
作为一个AI助手,我并不真正知道今天是2023年的4月24日,我提供的热门话题信息都是我从过去报道和知识积累中推导得出的。我没有办法准确地告知您2023年4月24日今天中文互联网上的实时热点,我的知识和计算能力有限制。
面对如此诚恳的态度,果酱妹也不好多加指责,只在随后提问了两个历史日期发生的事件,正确率属实不高。
显然,Claude在新闻资讯收集方面仍然有很大的缺陷,这与其并非专门做搜索内容应用有关,也体现了搜索引擎公司的数据库对于一个成功的AI助手有巨大影响力。
放弃和Claude纠结具体某日的资讯,果酱妹又让其用今天的热点新闻写一篇文章,从内容角度看是及格的,既有新闻事实描述,又有结合行业进行分析,甚至还有过渡句和连接词,中文阅读感是非常流畅的。
值得注意的是,据Claude自述,其单次输出的字数有上限,为2000个中文字符或者1000个英文单词左右。
或许是出于设定好的交流习惯,Claude对于自己的回答总会做出一番说明,其解释称因回复内容实时生成,无法输出预先存储的长篇回复,当前的技术水平也难以生成长篇和深度回复,再加上交互接口、希望用户快速找到所需消息的设计、运行环境要求等原因,都导致了存在输出上限
问及和ChatGPT的区别时,“端水大师”Claude非常快速地罗列出两者的优势,表示ChatGPT在研究与技术水平上更厉害,而自己作为一款面向普通用户的商业产品,在产品体验与可靠性方面更占优势。
众所周知,ChatGPT会做算数题,果酱妹随手打了一串数字,提问乘积,Claude缓慢地响应,并给出了一个错误答案,下方还附注说明其不擅长解决数学问题。
果酱妹再次追问,Claude火速认错,并展示了计算过程,然后再次给出了错误答案。
几个回合提问下来,虽然Claude都无法给出正确答案,但是认错态度真诚到让人难以斥责。Claude甚至认知到,“作为一款AI助手,失去用户的信任与信心将是最严重的失败。”
在随后的测试中,Claude展现出对脑筋急转弯等创意发散类题目的不擅长。而当果酱妹希望Claude说明自己上线的时间,但无论如何更换关键词,Claude都没有办法理解问题的意思。同时,答案下方再次附注显示,Claude并不那么了解自己的创造者Anthropic。
一番体验下来,Claude的优缺点都很明显。
关于其被众人口口相传的不收费、不用注册、支持中文三大优势,实际上,除了目前不收费,注册只是稍稍简便,中文语感流畅但并不能完全理解挂钩当时语境的真正意义。而逻辑类、数学类问题就完全是Claude的盲区了。
可见,作为ChatGPT的竞品,Claude恐怕对打败前者有心无力。不过,挡不住Claude免费,比起情绪不够稳定还收费的ChatGPT,Claude更像是任劳任怨的纯种打工人,想体验AI助手的小伙伴大可以零成本玩一把。
02#
AI赛点到了吗?
从去年年底,ChatGPT引爆网络以来,AI 成了流量新贵,各大厂也在其中卷生卷死。但大半年过去了,得到一致认可的明星还是只有一个ChatGPT。
从这个角度来说,AI领域仍未到真正的赛点,各家的产品都还在成长期,没有达到可以拿出来华山论剑的地步。
比如,尽管ChatGPT作为当之无愧的霸主,但实际上其也经常出现bug,就在美国东部时间4月23日晚间,财联社报道称根据中断跟踪网站Downdetector的数据,超千名用户报告Open AI出现使用问题。
这其中有多家巨头共同明示过的算力不足的问题,也有技术不稳定性因素,都是当前大部分AI产品的通病。但根据斯坦福的调研报告显示,近八成国人看好技术发展,AI产品的前景仍然被期待。
而在这各自蛰伏的前期,恰恰是我们最应该关注AI动态的时间,因为局面还没有定论,技术内卷还在继续,谁也没法断定最后闯出来的会是哪家黑马,谁都有机会先尝一波红利。
当下的AI技术日新月异,虽然还未到取代人类工种的地步,但很多变化已经在悄悄发生。Claude不是第一个剑指ChatGPT的AI产品,也不会是最后一个,让我们一起期待这场技术变革将掀起的影响巨浪。