ChatGPT中国数学题挑战！它能全答对吗？

作者：呆科技发布时间：2023-02-12

ChatGPT 编程

Hello，大家好，我是大卫呆。

上期节目我给大家介绍了一下最近极其火爆的ChatGPT，以及不久的将来可能对我们的职业造成的影响。它不仅能回答各种生活问题，还能写宣传语、写代码甚至做数学题，而且支持中文！

今天咱们来个有意思的测试，我准备了5道小学水平的数学题，咱们看看ChatGPT到底能不能都正确的解答。

你说为什么只用小学水平的数学题？那是因为初中以上的题有很多的特殊符号，很难输入到文字框中。而且，如果ChatGPT连小学数学题都做不了也就不用考虑更难的题了。所以咱们先来看看它对小学数学题的解题能力如何。

话不多说，咱们直接上题。

第一题：7年前，妈妈年龄是儿子的6倍，儿子今年12岁，妈妈今年几岁。

我们来看看标准答案：

年龄问题，7年前，儿子年龄为12-7=5岁，而妈妈年龄是儿子的6倍，所以妈妈七年前的年龄为5×6=30岁，那么妈妈今年37岁。

接下来我们看看ChatGPT的回答对不对。

回答正确，而且解题思路也和标准答案几乎相同。

这是一道比较简单的数学题，但难点在于ChatGPT对于中文语义的理解。可以看到，它完全理解了中文语义并给出了正确的答案。要知道ChatGPT可是国外开发的程序，它的开发者可能都无法理解中文，但它却做到了。

当然也不排除ChatGPT背后也有中文大佬参与的可能性。

第二题：有一串彩珠，按“2红3绿4黄”的顺序依次排列。第600颗是什么颜色？

还是先看标准答案：

周期循环问题，以2+3+4=9个一循环，600÷9=66....6，余数为6，所以第600颗是黄颜色。

再来看看ChatGPT的回答。

回答正确，解题思路也和标准答案相同。但注意这里ChatGPT出现了一个中文错字。

这道题的难度要比第一题大，如果只看问题，各位看文章的朋友们能答出来吗？ChatGPT不但要理解中文中的“红绿黄”，还要和数学计算混在一起才能解出正确答案，但它做到了。

第三题：建筑工地有一批砖，最上层两块砖，第2层6块砖，第3层10块砖……，依次每层比其上一层多4块，已知最下层有2106块砖，这堆砖共有多少块?

这回再次加大了难度，不但要理解中文每句话的逻辑及含义，还要根据这些内容加入数学计算。

我们还是先看标准答案：

根据题意设层数为n，A1=2，An=2106，D=4，

2106=2+（n-1）×4，

2106=2+4n-4，

4n=2106+2，

4n=2108，

n=2108÷4，

n=527，

（2+2106）×527÷2，

=1110916÷2，

=555458（块），

答：这堆砖共有555458块．

下面有请ChatGPT作答。

ChatGPT同样给出了完整的解题步骤，不过这次结果出错了。

可以看到ChatGPT在计算层数的时候就出现了错误，所以想让ChatGPT帮你做作业的朋友要小心了，答案不一定是对的。

第四题：把100根小棒分成10堆，每堆小棒根数都是单数，且一堆比一堆少2根，应如何分?

标准答案：

这是一个等差数列，Sn=nA1+[n(n-1)d]/2 ，所以100=10A1+10×9×2/2，解得A1=1

所以分成的10堆数量依次是1、3、5、7、9、11、13、15、17、19。

这次ChatGPT能答对吗？

ChatGPT回答正确。

最后第五题，我们加大难度，来个中文的逻辑推理题，我们看看ChatGPT的表现如何。

警方查询了三个可疑的人，这三个人中有一个是小偷，讲的全是假话。有一个人是从犯，说起话来真真假假，还有一个人是好人，句句话都是真的，查询中问及三个人的职业，回答是：

甲：我是推销员，乙是司机，丙是美工设计师。

乙：我是医师，丙是百货公司的业务员，甲呀，你要问他，他肯定说是推员。

丙：我是百货公司的业务员，甲是美工设计师，乙是司机。

请问这三个人中说假话的小偷是谁？

这道题对于ChatGPT不仅仅是逻辑问题，而且要非常熟练的理解中文的语法等含义，对于一个人工智能来，这可以说是中文里比较难的考验，我们看看它的表现如何。

首先标准答案是：

这是个逻辑推理题，关键是找到切入点，其中乙说的第三句话一定是真的，因为问甲甲的确是说自己是推销员，所以乙一定不是小偷，那么就分乙是从犯或好人两种情况来考虑，很容易就能判断出甲是小偷。

大家记住这个正确答案，下面有请ChatGPT作答。

ChatGPT的答案是甲是小偷，回答正确！而且我们仔细看它的解答也非常符合判断逻辑。说明ChatGPT不但理解逻辑，而且理解中文！

怎么样，你震惊吗？大家觉得ChatGPT的表现如何？

就我个人来评价一下，一共让ChatGPT做了5道中国小学水平的数学题，4对1错。正确率75%。由于测试样本只有5道题，所以也并不能说明什么问题，但至少能看出2点。

1. ChatGPT对于中文的理解非常让人惊叹，要知道中文在全球来讲都是非常复杂的语言系统，但一个人工智能竟然能顺利的答出中文的逻辑问题，确实让人惊讶。

2. ChatGPT真的可以用来做中国的数学题包括中文的逻辑推理题。虽然答错了一道，但可以看到ChatGPT的答题正确率很高，解题思路也基本都是对的。

但是，这里大家也不要觉得ChatGPT有多么神奇，上期节目已经让它自己解释了一下名字的由来。其中GPT缩写是来自Generative Pretrained Transformer。

而里面的“Pretrained”表示在模型被部署之前已经通过大量语料进行了预训练，以提高它的性能和泛化能力。也就是说"ChatGPT"是预先通过海量内容学习的。而我所找的小学数学题全部来自网上，所以并不排除ChatGPT的海量学习中包括我上面的几道题。而唯一答错的，可能是ChatGPT对中文支持的还不够完美或者题库中没有，当然也可能是本身算法上产生的问题。

但ChatGPT确实已经不仅仅是聊天助手这么简单了，它确实开始朝着科幻片里人工智能的方向在走，也许就在不久的将来，它就可以做到无论什么问题都能以人类的方式给你正确的答案，那必定会引起整个人类文明的巨大变化。您对此有什么看法，不妨在评论区讨论一下。

我是大卫呆，如果您觉得内容有用欢迎点赞、评论和转发，谢谢您的支持，我们下期见！

ChatGPT中国数学题挑战！它能全答对吗？

推荐体验

相关资讯

这道数学题，Kimi和豆包谁答对了？

韦神出初中数学题难倒ChatGPT-4 ？编程都行，初中数学题不行？

ChatGPT官宣数学能力史诗级更新，竟做对小学数学题！

北京大学韦东亦出的一道数学题，ChatGPT挑战失败

“韦神”出数学题，GPT-4挑战失败，初二学生给出标准答案！

近期资讯

联诚精密：下属子公司部分零件产品应用于工业机器人领域

vivo Y200＋发布骁龙4 Gen 2＋720P屏幕 1099元起

从“支付”到“智付” 数字人民币塑造消费新生态

各界拥抱AI规模化产业应用契机

自主研制科考+考古！“探索三号”交付启航

民航无线电“安全卫士”：为每次飞行编织安全网

黄埔文冲科技成果入选“2024中国智能制造十大科技进展”

王腾：没想到这波骁龙8 Gen3机型REDMI K80售价最高销量最好

亚信科技斩获5项“星河”标杆案例，获评数据产业代表性厂商

乔治·斯穆特：科学的真正意义不在于答案，而在于不断提出问题｜比亚迪·封面对话诺奖得主

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响