2023年3月16日,百度生成式AI产品文心一言正式发布,号称对标chatGPT。你说,这个文心一言厉害吗?虽然消息发布后,股票一阵猛跌,用户也吐槽纷纷……但咱们的记者小哥哥依然跃跃欲试,拿到了一个内测账号。我们跟着他一起去试试,到底好使不好使。
ROUND 1 考语文
记得发布会上李彦宏说,“这个AI的英文现在确实不行,中文还是不错的”。这让人想到了百度早年的广告:“百度更懂中国人”。那么下面这句话到底能有多少种断句方法呢?
问了文心一言,结果,他把这句话物理上切断了。
再问问chatGPT,他显然明白了是什么意思,给出了三种断句方法和其意义。顺便说一下,这个chatGPT还只是3.5的版本。
ROUND 2 考数学
直播演示的时候,李彦宏曾演示了鸡兔同笼问题,其实相同的问题咱也问过chatGPT,当时chatGPT也答不出来,而且教不会。
那么,文心一言是不是做过优化,两元一次方程肯定不在话下呢?于是记者问了个刁钻的数学问题,让他们证明:只要给出的脚的数量是大于2倍头的数量小于4倍头的数量的偶数,这道题就是有解的。请注意,出题的时候是故意出错的哦!结果,文心一言直接死机了。
chatGPT则是做了一大堆证明……但因为题目是给错了,结论自然也是错的,他没发现。
ROUND 3 考逻辑
语文数学都考了,下面该考什么呢?想到直播时最震撼的是文心一言自动生成视频,那就考考生成视频吧。结果,记者的账号就是没能生成视频,可能是内测账号和百度CEO李彦宏账号的权限上有区别?
要不,就给定关键词让他们写作文试试。记者给出的题目是:以青蛙、鸡蛋和晴天为题写一篇作文。要是人类,很容易就写出:晴天我们去野餐,吃着鸡蛋饼,看到池塘里小青蛙之类的文章,然而,百度生成的答案是这样的↓
chatGPT稍好一些,不过逻辑上也有问题。
ROUND 4 考应用
最后考考规划能力吧。以出行欧洲为例,记者给出了要求规划13天行程,从上海往返阿姆斯特丹的自驾游,让他俩设计下行程。文心一言给出的建议是,有一个礼拜天天在上海旅游。
chatGPT给出的规划相对科学,这次是压倒性的胜利。
看到这里,大家是不是觉得被泼了冷水呢?
客观来说,记者对于文心一言试下来的感受是,与此前询问机器人,还有必须触发关键词才能有相关回复的所谓AI不同,文心一言确确实实是真的在思考问题的。比如故意问一个错的问题:地球是自西向东旋转,为什么月球绕地球旋转是自东向西?文心一言不仅指出了错误,还给出了相应解释。而chatGPT论证了老半天,愣是没有发现咱就是在骗他。
当然,目前版本的文心一言的确还存在这样那样的问题。不过,当看到这个产品走的路线并不是以前触发关键词就回答相应内容且有自己逻辑和学习能力的时候,我们还是觉得很欣慰的。文心一言作为刚出笼的产品,要一跃超过chatGPT是不科学的,因为,并不是什么事情都有后发优势和弯道超车的机会。但我们相信,百度和其它国内科技巨头只要沿着科学的研发方向往下走,未来还是会有相当不错成绩的。
记者丨陈俊杰
编辑丨由由酱
视频丨薯条