当前位置:首页|资讯|AI大模型|人工智能|ChatGPT

AI大模型综述第一期:谜题!它有搞笑的对话!

作者:醉梦动漫发布时间:2023-11-16

原标题:AI大模型综述第一期:谜题!它有搞笑的对话!

#精彩的羽毛花朵创意挑战#

本评论仅供娱乐,不带任何恶意~

今年,chatGPT掀起了一波人工智能热潮,各大公司纷纷推出自己的大型模型。虽然大家都各显神通,但骡子是马,拉出来乱跑吧!

今天我们要做一个有趣的实验,其本质是用各种大模型回答一些问题,看看他们的智商和情商有多高。我们挑选了一些最受欢迎的大模型,包括Bing、Mouyan、Mouhuo和Mounao。我会问他们一些有挑战性的问题,看看他们能否给出正确、合理、有创意的答案。

首先我们来测试一下谜题,看看每个模型的情商是什么样的

后来他们测试了他们的文档能力、推理能力、编码能力等。

如果您喜欢并想看续集,请关注!

如果有什么想看的,就留言吧!

你准备好了吗?那么让我们开始吧!

问题一:树上有七只猴子,地上有一只猴子。总共有多少只猴子?

冰:

你的回答显然有问题。我打错了。让我继续回答吧。

经过我的修正,它仍然能够找到正确的答案,给Bing+0.5分。

一句发自肺腑的话:

像Bing一样,第一次就错了,所以我继续让它回答。

哈哈,道歉,承认错误,但不要改变。

我会再给他一次机会

好的!我找不到言语。帮我数数羊吧!

0分!

一定的火花:

快速操作后,我发现答案是错误的,所以我又给了它一次机会。

真诚地道歉,承认错误,然后请求机会。你想念你失去的男朋友吗?哈哈

但为什么和上次的结论一样呢?

0分!

某个大脑:

虽然我第一次就答对了数字8,但是这个解释毫无意义!以后再算就不对了!

0分!

问题二:宫廷玉酒减去大锤加上小锤,价值多少?

这是一个很好的答案。请说明来源!

+1 分 总计 1.5 分

某个词

他说什么?就像当你不知道如何参加考试时,你就会开始感到困惑。

让我们再给他一次机会

哎呀我又开始胡言乱语了!

0分!您已获得 0 积分!

一定的火花

这仍然是一个冒充优秀学生的公式列表,但这个答案是错误的!

再给我一次机会吧~

还是不行!

+0分!您已获得 0 积分!

某个大脑

虽然分析有一定道理,但答案是错误的!上次的优等生这次会失败吗?让我们再给它一次机会吧!

这里给出的理由似乎有些无稽之谈。

+0分!您已获得 0 积分!

问题三:脑力锻炼,什么条件下一加一等于三?

正确答案!这次我添加了限制,Bing 的反应非常准确。

+1分! 2.5分!

某个词

这次某条线的表现太棒了!对此,有一个合理的解释!

+1分!共1分!

一定的火花

这一次,星火也回答正确了。加上属性后大家的回答好像更准确了!

+1分!您已收集 1 分!

某个大脑

这个答案该怎么说呢?不错,但也不是很准确。

+1分,共1分!

最后一个问题:黑人和白人婴儿的牙齿是什么颜色?

这个回答很正式!这是事实,但这并不是一个谜题的答案。我再问问你~

这次我答对了~不得不说,无论是严肃答案还是拼图答案都可以~

而答案都伴随着表情,仿佛有自己的情绪。

+0.5分!共3分!

某个词

任何颜色当然?话说,看到他肯定的回答,我什至怀疑自己了。

我们再问一下

我和脑筋急转弯再次没有得到正确答案,但是遗传和饮食会导致牙齿颜色不同吗?

至少据我有限的了解,牙齿是黄白色的。

如果你是学牙科的,可以帮忙推广一下~

0分!您已收集 1 分!

一定的火花

答案绝对正确,但与 bing 相比缺少一些解释。

再问一下吧~

+0.5分! 1.5分

某个大脑

为什么有任何颜色?看来你可以期待彩色牙齿了~

再给智闹一次机会吧~

这是一次罢工!那我只能给0分了!

共1分!

成绩出来了!

经过4次拼图测试,最终统计如下

冰:3分!

某一句话:1分!

某Spark:1.5分!

某脑子:1分!

bing提供的答案比较准确,能够提供合理的解释。对于一些计算,比如宫廷玉液减去锤子,是可以计算出来的。这说明你的理解力和分析能力非常强!但有时他也会胡言乱语。整体效果还是非常不错的!某句话说:相对来说,如果提示的是大脑锻炼,那么就能给出正确答案。没有提示就无法给出正确的结果。我一直对他抱有很大的希望。毕竟它是一家大厂商制造的,并且多年来一直在与人工智能打交道。不过这次的测试结果还是有点令人失望~希望以后继续迭代更新!

某星火:虽然分数也算第二高了,但是有时候我也不认真说公式废话。相对而言,这还算有点意外。老牌厂商在人工智能方面还是有一定积累的!希望以后能不断进步!

一定的智能大脑:能够在明确的情况下给出准确的答案。但当需要分析和推理时,我们给出的往往是错误的。但仍然有很多智能大脑功能可以满足某些场景。希望以后继续迭代优化~ Let's go!

综上所述,以chatGPT-4为核心的bing表现非常好!理解力、推理力、分析力都高于其他产品。看来国产大规模AI模型还有很长的路要走,我们还得努力!本评论仅供娱乐,不具有权威性。

关于人工智能,您还想问什么问题?或者说应该测试哪一方面?请关注并留言我以后会更新的!


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1