当前位置:首页|资讯|ChatGPT|编程

ChatGPT中国数学题挑战!它能全答对吗?

作者:呆科技发布时间:2023-02-12

Hello,大家好,我是大卫呆。

 

上期节目我给大家介绍了一下最近极其火爆的ChatGPT,以及不久的将来可能对我们的职业造成的影响。它不仅能回答各种生活问题,还能写宣传语、写代码甚至做数学题,而且支持中文!

 

今天咱们来个有意思的测试,我准备了5道小学水平的数学题,咱们看看ChatGPT到底能不能都正确的解答。

 


你说为什么只用小学水平的数学题?那是因为初中以上的题有很多的特殊符号,很难输入到文字框中。而且,如果ChatGPT连小学数学题都做不了也就不用考虑更难的题了。所以咱们先来看看它对小学数学题的解题能力如何。

 

话不多说,咱们直接上题。

 

第一题:7年前,妈妈年龄是儿子的6倍,儿子今年12岁,妈妈今年几岁。

我们来看看标准答案:

年龄问题,7年前,儿子年龄为12-7=5岁,而妈妈年龄是儿子的6倍,所以妈妈七年前的年龄为5×6=30岁,那么妈妈今年37岁

 

接下来我们看看ChatGPT的回答对不对。

 

回答正确,而且解题思路也和标准答案几乎相同。

 

这是一道比较简单的数学题,但难点在于ChatGPT对于中文语义的理解。可以看到,它完全理解了中文语义并给出了正确的答案。要知道ChatGPT可是国外开发的程序,它的开发者可能都无法理解中文,但它却做到了。

 

当然也不排除ChatGPT背后也有中文大佬参与的可能性。

 

第二题:有一串彩珠,按“2红3绿4黄”的顺序依次排列。第600颗是什么颜色

还是先看标准答案:

周期循环问题,以2+3+4=9个一循环,600÷9=66....6,余数为6,所以第600颗是黄颜色

 

再来看看ChatGPT的回答。

 

回答正确,解题思路也和标准答案相同。但注意这里ChatGPT出现了一个中文错字

 

这道题的难度要比第一题大,如果只看问题,各位看文章的朋友们能答出来吗?ChatGPT不但要理解中文中的“红绿黄”,还要和数学计算混在一起才能解出正确答案,但它做到了。

 

第三题:建筑工地有一批砖,最上层两块砖,第2层6块砖,第3层10块砖……,依次每层比其上一层多4块,已知最下层有2106块砖,这堆砖共有多少块?

 

这回再次加大了难度,不但要理解中文每句话的逻辑及含义,还要根据这些内容加入数学计算。

 

我们还是先看标准答案:

根据题意设层数为n,A1=2,An=2106,D=4,

2106=2+(n-1)×4,

2106=2+4n-4,

4n=2106+2,

4n=2108,

n=2108÷4,

n=527

(2+2106)×527÷2,

=1110916÷2,

=555458(块),

答:这堆砖共有555458块

 

下面有请ChatGPT作答。

 

 

 

 

ChatGPT同样给出了完整的解题步骤,不过这次结果出错了

可以看到ChatGPT在计算层数的时候就出现了错误,所以想让ChatGPT帮你做作业的朋友要小心了,答案不一定是对的。

 

第四题:把100根小棒分成10堆,每堆小棒根数都是单数,且一堆比一堆少2根,应如何分?

标准答案:

这是一个等差数列,Sn=nA1+[n(n-1)d]/2 ,所以100=10A1+10×9×2/2,解得A1=1

所以分成的10堆数量依次是1、3、5、7、9、11、13、15、17、19

 

这次ChatGPT能答对吗?

 

 

 

ChatGPT回答正确。

 

最后第五题,我们加大难度,来个中文的逻辑推理题,我们看看ChatGPT的表现如何。

 

警方查询了三个可疑的人,这三个人中有一个是小偷,讲的全是假话。有一个人是从犯,说起话来真真假假,还有一个人是好人,句句话都是真的,查询中问及三个人的职业,回答是:

 

甲:我是推销员,乙是司机,丙是美工设计师。

乙:我是医师,丙是百货公司的业务员,甲呀,你要问他,他肯定说是推员。

丙:我是百货公司的业务员,甲是美工设计师,乙是司机。

 

请问这三个人中说假话的小偷是谁?

 

这道题对于ChatGPT不仅仅是逻辑问题,而且要非常熟练的理解中文的语法等含义,对于一个人工智能来,这可以说是中文里比较难的考验,我们看看它的表现如何。

 

首先标准答案是:

这是个逻辑推理题,关键是找到切入点,其中乙说的第三句话一定是真的,因为问甲甲的确是说自己是推销员,所以乙一定不是小偷,那么就分乙是从犯或好人两种情况来考虑,很容易就能判断出甲是小偷

 

大家记住这个正确答案,下面有请ChatGPT作答。

 

 

ChatGPT的答案是甲是小偷,回答正确!而且我们仔细看它的解答也非常符合判断逻辑。说明ChatGPT不但理解逻辑,而且理解中文!

 

怎么样,你震惊吗?大家觉得ChatGPT的表现如何?

 

就我个人来评价一下,一共让ChatGPT做了5道中国小学水平的数学题,4对1错。正确率75%。由于测试样本只有5道题,所以也并不能说明什么问题,但至少能看出2点。

 

1. ChatGPT对于中文的理解非常让人惊叹,要知道中文在全球来讲都是非常复杂的语言系统,但一个人工智能竟然能顺利的答出中文的逻辑问题,确实让人惊讶。

 

2. ChatGPT真的可以用来做中国的数学题包括中文的逻辑推理题。虽然答错了一道,但可以看到ChatGPT的答题正确率很高,解题思路也基本都是对的。

 

但是,这里大家也不要觉得ChatGPT有多么神奇,上期节目已经让它自己解释了一下名字的由来。其中GPT缩写是来自Generative Pretrained Transformer。

 

而里面的“Pretrained”表示在模型被部署之前已经通过大量语料进行了预训练,以提高它的性能和泛化能力。也就是说"ChatGPT"是预先通过海量内容学习的。而我所找的小学数学题全部来自网上,所以并不排除ChatGPT的海量学习中包括我上面的几道题。而唯一答错的,可能是ChatGPT对中文支持的还不够完美或者题库中没有,当然也可能是本身算法上产生的问题。

 

但ChatGPT确实已经不仅仅是聊天助手这么简单了,它确实开始朝着科幻片里人工智能的方向在走,也许就在不久的将来,它就可以做到无论什么问题都能以人类的方式给你正确的答案,那必定会引起整个人类文明的巨大变化。您对此有什么看法,不妨在评论区讨论一下。

 

我是大卫呆,如果您觉得内容有用欢迎点赞、评论和转发,谢谢您的支持,我们下期见!



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1