本文概要:
1. 一项研究比较了 ChatGPT、Bard 和 Bing 在回答生理学案例中的表现。
2. ChatGPT 在77个案例中显著优于其他模型。
3. 人工智能系统在医学教育中的潜力,但还需要进一步研究验证其在不同领域的有效性。
站长之家(ChinaZ.com)8月8日 消息:根据一项研究对 OpenAI 的 ChatGPT、Google 的 Bard 和 Microsoft 的 Bing(精确模式)在回答77个生理学案例中的表现进行了比较。
结果显示,ChatGPT 明显优于其他模型,得分为3.19±0.3,而 Bard 得分为2.91±0.5,Bing Chat 得分为2.15±0.6(评分范围为0至4)。
研究强调了将人工智能系统纳入医学教育的潜力,但也指出需要进一步研究来确定这些模型在不同医学领域的有效性。
此外,特定针对医疗任务进行微调的人工智能模型,如谷歌最近推出的 Med-PaLM M,也有可能在这场比赛中获胜。该研究的结果对于医学教育领域具有重要意义,并为未来的研究和开发提供了参考。