Hello,大家好,我是大卫呆。
上期节目我给大家介绍了一下最近极其火爆的ChatGPT,以及不久的将来可能对我们的职业造成的影响。它不仅能回答各种生活问题,还能写宣传语、写代码甚至做数学题,而且支持中文!
今天咱们来个有意思的测试,我准备了5道小学水平的数学题,咱们看看ChatGPT到底能不能都正确的解答。
你说为什么只用小学水平的数学题?那是因为初中以上的题有很多的特殊符号,很难输入到文字框中。而且,如果ChatGPT连小学数学题都做不了也就不用考虑更难的题了。所以咱们先来看看它对小学数学题的解题能力如何。
话不多说,咱们直接上题。
第一题:7年前,妈妈年龄是儿子的6倍,儿子今年12岁,妈妈今年几岁。
我们来看看标准答案:
年龄问题,7年前,儿子年龄为12-7=5岁,而妈妈年龄是儿子的6倍,所以妈妈七年前的年龄为5×6=30岁,那么妈妈今年37岁。
接下来我们看看ChatGPT的回答对不对。
回答正确,而且解题思路也和标准答案几乎相同。
这是一道比较简单的数学题,但难点在于ChatGPT对于中文语义的理解。可以看到,它完全理解了中文语义并给出了正确的答案。要知道ChatGPT可是国外开发的程序,它的开发者可能都无法理解中文,但它却做到了。
当然也不排除ChatGPT背后也有中文大佬参与的可能性。
第二题:有一串彩珠,按“2红3绿4黄”的顺序依次排列。第600颗是什么颜色?
还是先看标准答案:
周期循环问题,以2+3+4=9个一循环,600÷9=66....6,余数为6,所以第600颗是黄颜色。
再来看看ChatGPT的回答。
回答正确,解题思路也和标准答案相同。但注意这里ChatGPT出现了一个中文错字。
这道题的难度要比第一题大,如果只看问题,各位看文章的朋友们能答出来吗?ChatGPT不但要理解中文中的“红绿黄”,还要和数学计算混在一起才能解出正确答案,但它做到了。
第三题:建筑工地有一批砖,最上层两块砖,第2层6块砖,第3层10块砖……,依次每层比其上一层多4块,已知最下层有2106块砖,这堆砖共有多少块?
这回再次加大了难度,不但要理解中文每句话的逻辑及含义,还要根据这些内容加入数学计算。
我们还是先看标准答案:
根据题意设层数为n,A1=2,An=2106,D=4,
2106=2+(n-1)×4,
2106=2+4n-4,
4n=2106+2,
4n=2108,
n=2108÷4,
n=527,
(2+2106)×527÷2,
=1110916÷2,
=555458(块),
答:这堆砖共有555458块.
下面有请ChatGPT作答。
ChatGPT同样给出了完整的解题步骤,不过这次结果出错了。
可以看到ChatGPT在计算层数的时候就出现了错误,所以想让ChatGPT帮你做作业的朋友要小心了,答案不一定是对的。
第四题:把100根小棒分成10堆,每堆小棒根数都是单数,且一堆比一堆少2根,应如何分?
标准答案:
这是一个等差数列,Sn=nA1+[n(n-1)d]/2 ,所以100=10A1+10×9×2/2,解得A1=1
所以分成的10堆数量依次是1、3、5、7、9、11、13、15、17、19。
这次ChatGPT能答对吗?
ChatGPT回答正确。
最后第五题,我们加大难度,来个中文的逻辑推理题,我们看看ChatGPT的表现如何。
警方查询了三个可疑的人,这三个人中有一个是小偷,讲的全是假话。有一个人是从犯,说起话来真真假假,还有一个人是好人,句句话都是真的,查询中问及三个人的职业,回答是:
甲:我是推销员,乙是司机,丙是美工设计师。
乙:我是医师,丙是百货公司的业务员,甲呀,你要问他,他肯定说是推员。
丙:我是百货公司的业务员,甲是美工设计师,乙是司机。
请问这三个人中说假话的小偷是谁?
这道题对于ChatGPT不仅仅是逻辑问题,而且要非常熟练的理解中文的语法等含义,对于一个人工智能来,这可以说是中文里比较难的考验,我们看看它的表现如何。
首先标准答案是:
这是个逻辑推理题,关键是找到切入点,其中乙说的第三句话一定是真的,因为问甲甲的确是说自己是推销员,所以乙一定不是小偷,那么就分乙是从犯或好人两种情况来考虑,很容易就能判断出甲是小偷。
大家记住这个正确答案,下面有请ChatGPT作答。
ChatGPT的答案是甲是小偷,回答正确!而且我们仔细看它的解答也非常符合判断逻辑。说明ChatGPT不但理解逻辑,而且理解中文!
怎么样,你震惊吗?大家觉得ChatGPT的表现如何?
就我个人来评价一下,一共让ChatGPT做了5道中国小学水平的数学题,4对1错。正确率75%。由于测试样本只有5道题,所以也并不能说明什么问题,但至少能看出2点。
1. ChatGPT对于中文的理解非常让人惊叹,要知道中文在全球来讲都是非常复杂的语言系统,但一个人工智能竟然能顺利的答出中文的逻辑问题,确实让人惊讶。
2. ChatGPT真的可以用来做中国的数学题包括中文的逻辑推理题。虽然答错了一道,但可以看到ChatGPT的答题正确率很高,解题思路也基本都是对的。
但是,这里大家也不要觉得ChatGPT有多么神奇,上期节目已经让它自己解释了一下名字的由来。其中GPT缩写是来自Generative Pretrained Transformer。
而里面的“Pretrained”表示在模型被部署之前已经通过大量语料进行了预训练,以提高它的性能和泛化能力。也就是说"ChatGPT"是预先通过海量内容学习的。而我所找的小学数学题全部来自网上,所以并不排除ChatGPT的海量学习中包括我上面的几道题。而唯一答错的,可能是ChatGPT对中文支持的还不够完美或者题库中没有,当然也可能是本身算法上产生的问题。
但ChatGPT确实已经不仅仅是聊天助手这么简单了,它确实开始朝着科幻片里人工智能的方向在走,也许就在不久的将来,它就可以做到无论什么问题都能以人类的方式给你正确的答案,那必定会引起整个人类文明的巨大变化。您对此有什么看法,不妨在评论区讨论一下。
我是大卫呆,如果您觉得内容有用欢迎点赞、评论和转发,谢谢您的支持,我们下期见!