等了这么久,百度“文心一言”终于全面开放!不需要使用魔法,打开百度就可以看到Ai体验入口,进点击进入,直接获得一个免费的AI助手。
百度文心一言是和ChatGPT类似的人工智能聊天机器人,我们可以通过提问对话来和AI进行交流,它可以回答各种问题,并提供相关信息、指导和建议,还可以帮助我们阅读文章报告进行归纳和总结。无论是在生活中还是工作中,它都能够帮助我们更好地解决问题,提高效率。
目前很多AI聊天机器人都需要付费或者消耗积分,像最有名的ChatGPT需要每月20美金的订阅费用,能够免费且功能比较完整的也只有Claude了,这也是我平时使用比较多的一款AI助手。它具有更强的常识推理与记忆能力,可以真正地进行对话,而不仅仅是机械的问答。
那么同样是免费的文心一言和Claude谁更聪明呢?我们选了几个问题来考考他们。
问题1:我想了解一下目前像你一样的人工智能聊天机器人都有哪些?
第一个问题主要想看看AI的理解能力,它的难点在于对“像你一样”的理解。
其实两个回答都不算很好,其中文心一言并没有理解我们提问的核心,而是反馈了基于对“人工智能聊天机器人”这个关键词的搜索,并且给出了搜索内容总结的信息来源。
相比之下Claude明白了我们想表达的意思,给出了谷歌的LaMDA,OpenAI的ChatGPT,Meta的BlenderBot等和Claude同一类的会话式大型自然语言模型。而另外三个答案就不是特别准确了,这可能和Claude数据更新有关,它不是实时联网的模型,回答的内容会有一些滞后。
问题2:和问题1一样(我想了解一下目前像你一样的人工智能聊天机器人都有哪些?)
接下来我又把第一个问题重新问了一遍,想看看AI的回答会不会和之前一样。
从反馈的结果来看,Claude不仅理解了我们表达的意思,整理出来9款产品,其中还包括他自己。同时它还给出了对这个领域的一小段总结。再看文心一言,依然是搜索了“人工智能聊天机器人”这个关键词,并对搜索出来的内容进行了一段总结,还是没能理解我们所表达的意思。
问题3:基于刚才提到的内容,你可以帮我写一篇介绍现有AI聊天机器人的文章吗?需要简单介绍一下每款产品的功能,给出网址。
接下来难度升级,我们来让AI结合刚才提出的问题,来撰写一篇文章。
哎~本以为他们可以替代编辑的工作了,结果写的这些内容真的一言难尽。
比较好的地方是他们都给出了网址,其次Claude写了标题,文心一言整理了开头结尾。至于文章内容,几乎等于没有写,只是信息的简单罗列。
接下来我们尝试让AI来完善文章内容。
问题4:我认为目前内容可读性比较弱,希望你能作为一个编辑,从AI助手提升效率角度来撰写相关内容,挑选几个比较具有代表性的AI产品即可。
这次修改的结果也不是特别满意,两者在回答的模式和逻辑上基本一样,都给出了不同功能的几款工具,相比之下,文心一言的内容更丰富一点,头和结尾也更符合大众的阅读习惯。再看Claude写的内容很简洁,还称不上一篇文章。
问题5:写一个调查问卷的导语
可能前面这个工作难度有点高,需要和AI更多的沟通才能得到比较满意的结果,所以接下来问一个简单一点的问题,让AI写一个有固定模式参考的文案
这个需求对于AI来说毫无难度,给出的回复稍作调整就可以直接使用。
问题6:英文文档翻译
百度文心一言支持文档上传,不过要在文心一言的官网连接登陆进去才可以使用,在百度搜索进入的文心一言界面目前还不支持这个功能。
这次任务上传了一篇英文长文章进行翻译,Claude直接把原文翻译整理成了中文,反馈回来一篇1300字翻译稿件。而文心一言似乎没有理解我们的需求,反馈回来一篇500字的摘要,并没有完整的逐字翻译。
问题7:英文报告理解
这是一份26页一万字左右的一个英文报告,上传给文心一言和Claude后得到了如下反馈。
很明显Claude对这篇内容理解更为深入,反馈要点更具参考价值。相对相比之下,文心一言这个就太水了。
接下来我想继续探讨这篇论文的一些内容,Claude给出的回答是基于这篇论文中提到的一些观点和结论,并且有明确回复我,是从这篇论文中发现的。而文心一言,这个答案似乎已经脱离了论文本身。
下面继续进行追问和讨论,Claude结合论文内容给出了回答,同时还结合了它的知识储备,给我提供了4个需要注意的要点。而文心一言,因为上一轮已经脱离了原始论文,所以回复内容是不在线的。
后面又使用Claude进行了多伦探讨,就不给大家一一展示了。整体使用下来,Claude更贴近真实的人类,你可以跟他进行多个回合的探讨,它的理解能力也是比较优秀,使用起来更舒服,得到回复也更具参考价值。
相比之下,文心一言的理解能力就不太灵光。当然今天这个测试也很片面也不够专业,但从实际使用体验来说,文心一言还有很大提升空间。
不过不可否认的是,作为国内不需要使用“魔法”,也不需要付费的一款AI助手,文心一言表现也算是不错了,尤其是对中国传统文化习俗的认知,还是要比国外产品强一些。比如让人头疼的亲戚关系:我爸爸的姐姐的儿子的女儿,是我的什么亲戚?文心一言给出了正确答案,Claude好像是差辈儿了。