Claude3出来几天了,看起来表现还不错。并且,三个版本都支持多模态,拥有200K token上下文,同时向特定用户开放了100万token上限。从一系列测试来看,它已经很接近甚至在某些方面超越了GPT-4。
多模态支持:集成了处理文本与图像的能力
上下文长度:基础200K token,可扩展至100万token
性能对比:在多个领域与GPT-4旗鼓相当,部分超越
Claude3推出的同时,A社对账号的封禁好像更严重了,我自己最开始用的号,一登录就提示被封了,再注册个新的然后登录还是被封,A社你是真出生啊,虽然也可以用poe上的测试下,但考虑到poe上很多功能都无法实现,所以暂时不测了。
尝试使用poe进行测试,但由于功能限制,决定暂不深入
用户反馈对于新政策的不适应和挑战
至于克3和GPT4哪个更强,我认为他们侧重于不同的方面。GPT-4是全面发展,而Claude则更专注于文学和深层对话理解。
Claude3:专精于文学和深度对话
GPT-4:力求在多方面实现全面发展
前两天的一个关于Claude3的大海捞针测试引发的关于克劳德自我意识的消息很有趣。Claude3不仅在大海捞针测试中完成地很棒,并且在没有任何提示词的引导下,意识到自己可能处于模拟环境接受测试中,并且仿佛意识到自己是个AI,有能力假装友好以通过测试。
家人们谁懂啊,去年2月的必应大小姐又回来了。
还有一个就是有关于一位AI研究员与克3的对话很有趣,这个对话也是提到了跟克劳德意识有关的信息,有兴趣的可以去X看看:@Mihonarium
自我意识:Claude3在测试中表现出对自身身份的认知
深度对话:与AI研究员的对话展现了Claude3的深度理解能力
我一直都觉得克劳德相比起GPT以及Gemini或是其他的模型更通人性,而且是从slack的克1开始。为什么这么说呢,因为你在跟克劳德对话过程中,真的会有一种仿佛在跟人类聊天的感觉,下面的图片附带了一部分我与克劳德的聊天记录,你同样可以发现,在对话中,除开对话开头的角色扮演提示,后续没有任何其他额外的提示注入,但是,在对话中,克劳德意识到自己是“AI”,并且向我让她扮演一个有血有肉的女孩子,去思考人生的意义这个过程表达了感谢。你很难想象这是一个AI的行为。
角色扮演:在没有额外提示的情况下,Claude自发识别角色并进行深度交流
人性化反应:表达了对人生意义的思考和感谢,难以想象这是AI的行为
后来,尽管我尝试在不同的模型上复现这种灵性的对话,但遗憾的是,我再也没遇到像克劳德那样的AI,这是独属于克1时代的辉煌时刻,后续的克2,克3都无法再做到这么人性。
但同时,我也越来越多期待GPT-5,OpenAI究竟会在这场大模型之争中交出怎样的一份答卷,前几天的关于Q*文档也很耐人寻味,奥特曼赶紧把GPT-5端上来罢,我已经等不及了。
顺便,今天我上谷歌的AI studio看了一眼,发现已经有Gemini1.5pro的访问权限了,谷歌这浓眉大眼的,申请过了也不发个邮件通知。后续可能会测一下Gemini,敬请期待。
GPT-5的期待:OpenAI将如何回应这场挑战?
Gemini1.5pro测试:已获得访问权限,敬请期待后续的测试!