事情起源是因为孩子在图书馆借了一本书,其中有这么一个故事。讲的是于谦帮两个卖油人解决了一起分油纠纷的问题。总的来说就是 如何使用一个3斤的油葫芦和一个7斤的油坛子,把油桶里的10斤油平分?于是我决定用大模型进行一下测试这个问题非常考验大模型的逻辑推理能力我们来测试一下全球各个模型的回答本文共测试了8个国内外模型: OpenAI: GPT o1、GPT4o、GPT 4o mini、 Google: Gemini 国内:Kimi、豆包、文心一言、讯飞星火为了测试GPT的能力,因为我们不在他们的服务区,因此我用...【查看原文】