当前位置:首页|资讯

Kimi“视觉思考版”领先全世界,全面支持数、理、化、生等理科题目!

作者:jowa发布时间:2024-12-18

AI是知识工作者的挖掘机,大幅提升教学与科研生产力。

  • #ai 王珏老师AIGC教育应用文章集锦

————————————————

昨天,王珏老师突然发现“Kimi数学版”的按钮突然不见了,变成了一个小蓝眼镜:

而且还起了一个很怪的名字: Kimi视觉思考版

今天看到新闻才知道,原来是昨天(12.16),Kimi已经将数学版(称为K0)、整合进了全新的“视觉思考版”中(称为K1)。

——这个速度也太快了!要知道,Kimi数学版上线也不过才一个月的功夫……

更加不得了的是:

  • 在数学、物理、化学等基础科学学科的基准能力测试中,初代 k1 模型的表现 超过了全球标杆模型 OpenAI o1!

这可能是中国的大模型,首次真正超越美国!真是值得弹冠相庆了!

尤其是在“ 几何图形”的能力中, 在基础教育各阶段的几何和图形题专项基准能力测试中,k1-preview 成绩打平或超过了 OpenAl 的 o1 模型:

这让 k1 在真实应用场景中的性能相比于 OpenAl 和 Anthropic 的视觉模型有了大幅提升:

以下王珏老师对Kimi视觉思考版作了初步的测评,测评结论如下:

  • 支持直接上传、或粘贴题目图片(比原来的Kimi数学版方便很多)

  • 支持带图的题目,包括:几何计算题、几何证明题、物理计算题等(据王珏老师的使用经验,这可能也是世界范围内的首创)

  • 能解物理、化学、生物题,证明了Kimi已经具备了理科世界的知识、以及学科思维能力!

以下是测评详情:

————————————————

相比原来的Kimi数学版,“Kimi视觉思考版”的 第1个改进点是:支持直接上传或粘贴题目图片,如下例:

【第1】柳州市去年的小学数学六年级统测试图

现在,只把题目的图片复制粘贴上去,kimi就能开展解题了。

而上一版“Kimi数学版”不支持上传图片,所以还需要用其它方式将题目转换为latex代码,比较麻烦。

以上对话记录可扫如下二维码:

【王珏老师评述】可以看到,Kimi对于解题思路的阐释是极为清楚的——而且有时还很人性化,似乎是一个人一边思考、一边不断地念叨。这一点对于学习者来说,可以起到很好的思维引导作用,或许可以教学中发扬光大。

“Kimi视觉思考版”的第2个改进点是:支持解题题目中的图片,这是一个意义极为重大的突破,可能是 世界范围内首创吧!

【第二题】 带图的题,如:几何中的计算题

以上对话记录可扫如下二维码

【王珏老师评述】现在Kimi的解题思路还不一定是最合理的、或最短路径、有时会用高级的的知识与技巧来解决低级别的问题。另外,对于简单的问题,它会反反复复思考、检验,显得比较啰嗦——不过思维严谨也不能说是一件坏事。

总体来说,大部分题目确实能得到正确答案,包括竞赛试题。但最终卡壳的竞赛类试题、或偏难怪题,也不在少数。

【第三题】据说是一道小学数学竞赛题

虽然Kimi运用了多种思考路径,也没解出来,不过解题过程显示:它确实能“看懂”题目中图的意思:

【第四题】几何中的证明题,这回证得还不错,虽然确实有点啰嗦——一如既往地把每个思维过程表述得无比清晰:

“Kimi视觉思考版”的第3个改进点是:支持物理、化学、生物题目的知识与逻辑推理,看来是要对标OpenAI o1。

【第五题】物理中的图像题,也能轻松解决了:

【第六题】物理题中,Kimi也能理解和运用物理运动定律来推理了:

【第七题】化学题,做得不错,说明Kimi也有了化学知识库与思维能力

【第八题】生物高考题,居然也行,说明Kimi也有了生物学知识库与思维能力

【王珏老师评述】虽然结论对了,但中间Kimi的判断有一些不应该的模糊性 (这个模糊性是否具有合理性需要请生物老师来判断) 。通过最后的反思检查,才得出了正确的结论。

如欲将王珏老师的培训课程《AI时代教师必备技能》引入本单位(不针对个人),请到本公众号首输入”ai培训“,了解联系方式。

个人学习可到本公众号首页输入“aikc”,了解付费课程详情。

————————————————————

本公众号提供全面、深度的学习科学研究、微课与PPT研究、以及其它实用技术研究文章!到公众号首页输入代码查看更多研究:

  • aigcai教学应用技巧集

  • xxkx:学习科学研究文章

  • wk:微课超级大全,设计制作应用一网打尽

  • ppt:PPT技巧集


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1