3 月 16 日,继 OpenAI (北京时间 15 日凌晨)发布 GPT-4 并引发讨论热潮之后的第二天,百度在各家大厂中率先发布了大语言模型文心一言。二者,难免被拿来对比。
发布会上,百度创始人李彦宏介绍了文心一言的 5 个使用场景,但并没有做实际的产品演示,而是采用了录播的形式,这被认为是导致产品发布时引发股价同步下跌的最重要原因。而发布会后,产品也不会被开放给公众,只有一些接入企业和媒体才能够拿到内测邀请码。
因为不懂底层技术,笔者就简单分享下看完发布会的几点感受。
下面,笔者以截屏形式将李彦宏对文心一言的问题展示出来。同时,笔者也问了 Chat-GPT 一些相同的问题。
1. 商业文案创作:对于大语言模型,商业文案创作已经是看家技能,相信很多网友已经体验过了,很多营销服务的机构已经用 GPT-3.5 的 API 在营销领域做了一些应用层的解决方案,也是大语言模型商用的一个典型能力。
在发布会上,百度让文心一言给公司起名、写 slogan、写新闻稿,表现还不错。
2. 数理逻辑推算:文心一言回答了“鸡兔同笼”的经典小学数学题。这里第一个问题故意出错,文心一言能够发现漏洞,指出是题目出错了。在回答时,文心一言可以给出答案以及解题思路。
笔者将“鸡兔同笼”问题同样出给 ChatGPT,ChatGPT 也能够找出矛盾点,并且给出了貌似更辩证的回答。
3. 中文理解:
文心一言在回答“洛阳纸贵对应的经济原理”一题时,给出的答案在笔者看来正确,但比较浅显。对比之下,ChatGPT 的答案要更加系统和全面。
不过,在“用洛阳纸贵写一首藏头诗”的问题中,文心一言的确展示出对中文较强的理解能力,可以准确理解问题、并写出诗句。相比之下,笔者先问了 ChatGPT 同样的问题,ChatGPT 需要在笔者提醒下才能理解“藏头诗”的意思,而且发挥不稳定。
我的提问
网友的提问截图
之后,笔者用搭载 GPT-4 的新版 Bing 搜索引擎问了同样的问题,GPT-4 的文字处理能力似乎确实强于 GPT-3.5,一次就看懂了问题。
4、文学创作:
文心一言被投喂的信息比较新,2023 年 1 月末播出的《三体》电视剧也了解过。文心一言还回答了如何从哲学角度续写《三体》,给出的答案也不错。
对比一下,笔者去问了 Chat-GPT 以及新版 Bing 相同的问题,Chat-GPT 的回答也很丰富,但在回答“刘慈欣是哪里人”这一问题上存在事实错误,这可能和外网维基百科等平台整理的刘慈欣资料本身不准确有关。
5、多模态生成:
文心一言可以根据指令生成不同形式的内容,这是 GPT-4 目前做不到的。
不过,文心一言通过这一轮问答展示出的能力,又都是之前已经存在的。例如,为 2023 世界智能交通大会创作一张海报,类似于去年火起来的 AI 绘图功能。根据内容生成视频也是已经存在的功能,在剪映等视频剪辑类产品中很常见,至于生成视频的质量,由于缺乏多个案例做对比,还不好判断。而用方言朗读文字,也不是新鲜功能。
与 GPT-4 识别草图、然后按照草图写代码做一个网站出来相比,文心一言,更像是把 text-to-image、text-to-video 等功能做了一个集合。
目前看下来,文心一言和 GPT-4,甚至 GPT-3.5 都还有差距。在文心一言发布会后,百度股价迅速下跌后有所回升,但降幅仍达到 10.7%。不过,在发布会上,李彦宏和 CTO 王海峰多次强调,随着文心一言开始被使用,其成长速度会更快,一些现在处理不好的问题可能很快被优化。
不管怎样,百度都是国内第一个发布大模型的大厂,其压力可想而知,希望未来我们能很快用到国内首个大语言模型。读者朋友们对文心一言的评价如何,欢迎在评论区留下你的想法。