被孩子的寒假作业逼疯？实测三款主流国产大模型，哪家辅导作业最靠谱

作者：镁客网发布时间：2024-03-30

GPT-4 文心一言通义千问

寒假作业，大概是每个年代的孩子都逃不过的宿命。

而自从“双减”政策开始落实，教育回归家庭后，家长们也开始迎来了他们的“酷刑”——为孩子们辅导作业。

相信不少人都能在网上刷到被作业整崩溃的家长，有的因为孩子心不在焉苦口婆心，有的因为孩子怎么也听不懂气到捶桌，而更多家长则因为孩子课程知识点越来越丰富，未必能很好地为孩子答疑解惑。

可以说，寒假作业让家长和孩子们都犯了难。

不过，面对这个难题，家长们可以借助当下最火的AI大模型。

目前不少国产大模型都号称自带教育功能，最关键的是，这些国产工具都可以通过网页或App免费体验，对于大部分家长们来说，使用门槛足够低。

为此，笔者挑选了国内三款主流对话式大模型（讯飞星火、文心一言、通义千问）进行了多次提问，并且将他们与目前公认最强的GPT4大模型进行对比，看看他们在真实场景下辅导作业时，都有哪些表现？

国产大模型 VS GPT4

寒假说长不长，说短不短，由于中间夹杂着春节假期，大多数学生很难完整安排学习计划。

那如果我们以20天来计算，AI大模型会给孩子们安排什么样的学习计划呢？

（注：全文截图均按照：讯飞星火、通义千问、文心一言、GPT4进行排序）

总结：从篇幅来看，讯飞星火给出的计划非常详细（因为长度原因并未截全），并且详细到每个学科；GPT4与文心一言给出的方案内容大致相似，但前者在内容上更加丰富，而通义千问则具体到每个时间段。但总体来说，AI大模型生成的计划都过于笼统。

安排好学习计划后，下一步就是开始辅导作业了。

语数外题目实测

论语数外三门中最难的学科，大部分人可能首先会在数学上犯了难。

那么今天我们就看看AI大模型的解题能力如何？

（1）第一道是个小学数学应用题，涉及未知数和方程式。

总结：在使用截图时，通义千问给出了正确的方程式，但奇怪的是在计算时翻车。而其他三家大模型都因为识别数字原因列错了公式。

而在手动输入题目后，四家大模型都给出了正确答案，不过文心一言“别出心裁”使用用T代表未知数，这可能不太符合一般的教学习惯。

（2）有了应用题，几何题自然也不能错过。

结论：由于文心一言需要多次步骤，因此笔者并未继续操作，其他三家均给出了解题步骤。其中在观感上，还是国产大模型更胜一筹，而GPT4文字描述过多，总体来说这三家的表现都很不错。

做完数学题，让我们来几道英语题。

对于大部分家长来说，由于长期远离英语环境，词汇掌握量逐年下降，当孩子升入中学后，辅导英语就变得十分困难。

其中，长难句又是英语学习中最难的一部分，无法理解句子自然也很难选择正确答案。

就翻译来说，大部分AI大模型都可以给出准确的答案，但要做到“信达雅”，还是有一定的难度的。

（3）让我们先用一句经典的英文名句试试：

结论：不得不说，每家英翻中都很有诗意，其中GPT4和讯飞星火给出的翻译最为对仗，不过GPT4还附带了对原句的解释，通义千问则找出了原句的出处。

（4）那么换成考试真题的长难句后，表现又如何呢？

结论：在这句话的翻译上，之前表现平平的文心一言这一次翻译地最为出色。而其他三家则更加贴近直译。对于学生们来说，通俗易懂的翻译或许更适合应试。

比起数学和英语，语文学科更加考验中文能力，也正是在这一部分，GPT4遇到了难题。

（5）首先来一段文言文的翻译：

结论：或许是因为大模型在理解“白话文”和“文言文”时出现错误，目前均不支持全文翻译。在改为短句子后，翻译的准确性明显高了许多，笔者个人更偏好讯飞星火的翻译。

最后，让我们拿出“作者都觉得离谱”的现代文阅读，看看大模型们能不能读懂出题人的心。

这是一篇来自2023年全国高考的散文《给儿子》，原作者陈村，该文不仅篇幅较长，并且蕴含非常多的寓意。

（6）首先让大模型总结一下文章的内容：

（7）接着我们让大模型们来尝试下高考真题，看看他们是否可以理解段落背后的含义。

总结：从个人主观判断，三款国产大模型在中文理解能力还是强于GPT4，不过后在理解段落的回答上，表现也称得上超出预期。

结语

从以上的实测来看，对于家长们来说，国产大模型已经足够应对孩子们的日常作业。

而国产厂商们针对中文语境的持续优化，也让 AI 在教育领域的应用场景更加多元，让更多人享受到AI带来的价值。

例如今天下午举行的星火认知大模型发布会上，科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5，多个核心能力得到全面提升，其中在数学、语言理解、语音交互能力上已经超越GPT-4 Turbo。

在发布会上，刘庆峰着重介绍了通用人工智能对教育领域的赋能，他表示：“教育是人类进步的根本，关乎每一位个体，是真正的全民刚需。”

随着大模型的全新提升，新版本在视觉问答、联想推理等方面实现了高分应对，理解更加精确，表述也更好。

除了教育领域以外，国产厂商正利用大模型赋能千行百业，把大模型技术的创造力转化为促进产业高质量发展的新质生产力，正在成为行业的共同选择。

被孩子的寒假作业逼疯？实测三款主流国产大模型，哪家辅导作业最靠谱

国产大模型 VS GPT4

语数外题目实测

结语

推荐体验

相关资讯

辅导孩子作业的崩溃瞬间

秦朗巴黎丢寒假作业系摆拍，博主被处罚；董宇辉回应讲解质量差丨邦早报

chatgpt真的可以用来辅导孩子作业吗？

AI能帮助家长辅导孩子写作业吗？

联想至像Z1作业打印机评测辅导孩子作业不再焦虑

近期资讯

上海电气国轩取得电池液冷管路系统专利，解决异程管路系统流量分配一致性差的问题

惠州市强立科技取得可低温充电储能电池专利，保持电池组的充电效果和使用效果

苏州鼎乾能源取得水冷散热板专利，达到对板材进行冷却的目的

浙江天能储能科技发展有限公司取得用于储能的液冷电池插箱专利，降低电池模组出现局部过热的风险

湖南福德电气取得应用于储能模块的水冷散热回路专利，提高换热效率

合肥厘尔电气科技取得再生资源回收用预处理装置专利，提高对锂电池包回收的预处理效率

蜂巢能源取得电池包专利，提高电池包的换热效率和换热速率

浙江艾罗取得应用于储能电池箱散热的风道结构专利，有效提高对储能电池箱内电池模组的散热均匀度

蜂巢能源取得冷却板组件和电池包专利，使得电池包的温控更加准确

华阳集团新能取得散热储能集装箱专利，降低成本并避免热影响

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响