今天因为GPT4会员快到期了,正好最近觉得GPT4的能力有所下降(表现为越来越频繁的出错及胡言乱语),正好又赶上A社发布了Claude 3,并且试用下来免费版Claude 3 Sonnet的能力和速度我都比较满意,所以就把GPT 4的订阅换成了Claude Pro的订阅(这样可以用A社理论上最强的Claude 3 Opus,以及解除Sonnet的对话频率限制)
下面用一道线性代数的编程题简单测试一下A社和OpenAI的模型:
首先我们来看看GPT4:
原本以为GPT4因为自带运行Python的能力,所以代码水平应该比A社的模型强不少,结果没想到这货在我反馈报错后直接开始不知所云了
接下来看看免费的Claude 3 Sonnet:
在我反馈报错信息之后,终于写出来了能正常运行的程序,并且总体比GPT4快不少
最后来看下收费版的Claude 3 Opus:
幽默的事情出现了,Opus第一遍就写出了能“运行”的程序,但给出的3个case中无论Givens矩阵还是Householder矩阵都是错的,在我反馈了几次之后依然没能纠正,遂放弃,总体甚至不如免费的Sonnet,但是比GPT4强,至少写出来的东西能运行(或者也可以说不如GPT,因为更能误导人了)
总结:
OpenAI,别捣鼓你那Sora了,快快把GPT4.5或者GPT5端上来吧()
A社,你又在干什么?Opus怎么被你弄成了这个样子()