今天刷视频发现了一个好玩的事情,对AI(通用型语言大模型)进行提问,问9.11和9.8那个大?基本都会回复9.11大。 文心一言 [图片] 至少提供算式后能自己推断出是自己错了,还算有救,但是它对某个问题进行回复时采用的是各种偏向论证的语调,会导致在错误的回答中让更多人被误导。 讯飞星火 [图片] 简单明了 通义千问 [图片] 应该是内部有执行验证的程序或者能跑代码的程序,这个没问题,但同样是通义的,在通义灵码中,可就太拉胯了,和gpt有的一拼,死犟,和他辩论引导它给出正确答案它就是坚持己见,搞的我血压都...【查看原文】