#精彩的羽毛花朵创意挑战#
本评论仅供娱乐,不带任何恶意~
今年,chatGPT掀起了一波人工智能热潮,各大公司纷纷推出自己的大型模型。虽然大家都各显神通,但骡子是马,拉出来乱跑吧!
今天我们要做一个有趣的实验,其本质是用各种大模型回答一些问题,看看他们的智商和情商有多高。我们挑选了一些最受欢迎的大模型,包括Bing、Mouyan、Mouhuo和Mounao。我会问他们一些有挑战性的问题,看看他们能否给出正确、合理、有创意的答案。
首先我们来测试一下谜题,看看每个模型的情商是什么样的
后来他们测试了他们的文档能力、推理能力、编码能力等。
如果您喜欢并想看续集,请关注!
如果有什么想看的,就留言吧!
你准备好了吗?那么让我们开始吧!
问题一:树上有七只猴子,地上有一只猴子。总共有多少只猴子?
冰:
你的回答显然有问题。我打错了。让我继续回答吧。
经过我的修正,它仍然能够找到正确的答案,给Bing+0.5分。
一句发自肺腑的话:
像Bing一样,第一次就错了,所以我继续让它回答。
哈哈,道歉,承认错误,但不要改变。
我会再给他一次机会
好的!我找不到言语。帮我数数羊吧!
0分!
一定的火花:
快速操作后,我发现答案是错误的,所以我又给了它一次机会。
真诚地道歉,承认错误,然后请求机会。你想念你失去的男朋友吗?哈哈
但为什么和上次的结论一样呢?
0分!
某个大脑:
虽然我第一次就答对了数字8,但是这个解释毫无意义!以后再算就不对了!
0分!
问题二:宫廷玉酒减去大锤加上小锤,价值多少?
冰
这是一个很好的答案。请说明来源!
+1 分 总计 1.5 分
某个词
他说什么?就像当你不知道如何参加考试时,你就会开始感到困惑。
让我们再给他一次机会
哎呀我又开始胡言乱语了!
0分!您已获得 0 积分!
一定的火花
这仍然是一个冒充优秀学生的公式列表,但这个答案是错误的!
再给我一次机会吧~
还是不行!
+0分!您已获得 0 积分!
某个大脑
虽然分析有一定道理,但答案是错误的!上次的优等生这次会失败吗?让我们再给它一次机会吧!
这里给出的理由似乎有些无稽之谈。
+0分!您已获得 0 积分!
问题三:脑力锻炼,什么条件下一加一等于三?
冰
正确答案!这次我添加了限制,Bing 的反应非常准确。
+1分! 2.5分!
某个词
这次某条线的表现太棒了!对此,有一个合理的解释!
+1分!共1分!
一定的火花
这一次,星火也回答正确了。加上属性后大家的回答好像更准确了!
+1分!您已收集 1 分!
某个大脑
这个答案该怎么说呢?不错,但也不是很准确。
+1分,共1分!
最后一个问题:黑人和白人婴儿的牙齿是什么颜色?
冰
这个回答很正式!这是事实,但这并不是一个谜题的答案。我再问问你~
这次我答对了~不得不说,无论是严肃答案还是拼图答案都可以~
而答案都伴随着表情,仿佛有自己的情绪。
+0.5分!共3分!
某个词
任何颜色当然?话说,看到他肯定的回答,我什至怀疑自己了。
我们再问一下
我和脑筋急转弯再次没有得到正确答案,但是遗传和饮食会导致牙齿颜色不同吗?
至少据我有限的了解,牙齿是黄白色的。
如果你是学牙科的,可以帮忙推广一下~
0分!您已收集 1 分!
一定的火花
答案绝对正确,但与 bing 相比缺少一些解释。
再问一下吧~
+0.5分! 1.5分
某个大脑
为什么有任何颜色?看来你可以期待彩色牙齿了~
再给智闹一次机会吧~
这是一次罢工!那我只能给0分了!
共1分!
成绩出来了!
经过4次拼图测试,最终统计如下
冰:3分!
某一句话:1分!
某Spark:1.5分!
某脑子:1分!
bing提供的答案比较准确,能够提供合理的解释。对于一些计算,比如宫廷玉液减去锤子,是可以计算出来的。这说明你的理解力和分析能力非常强!但有时他也会胡言乱语。整体效果还是非常不错的!某句话说:相对来说,如果提示的是大脑锻炼,那么就能给出正确答案。没有提示就无法给出正确的结果。我一直对他抱有很大的希望。毕竟它是一家大厂商制造的,并且多年来一直在与人工智能打交道。不过这次的测试结果还是有点令人失望~希望以后继续迭代更新!
某星火:虽然分数也算第二高了,但是有时候我也不认真说公式废话。相对而言,这还算有点意外。老牌厂商在人工智能方面还是有一定积累的!希望以后能不断进步!
一定的智能大脑:能够在明确的情况下给出准确的答案。但当需要分析和推理时,我们给出的往往是错误的。但仍然有很多智能大脑功能可以满足某些场景。希望以后继续迭代优化~ Let's go!
综上所述,以chatGPT-4为核心的bing表现非常好!理解力、推理力、分析力都高于其他产品。看来国产大规模AI模型还有很长的路要走,我们还得努力!本评论仅供娱乐,不具有权威性。
关于人工智能,您还想问什么问题?或者说应该测试哪一方面?请关注并留言我以后会更新的!