生成式人工智能,一种新的生产力
——百度生成式人工智能大模型“文心一言”使用体验与思考
2022年11月30日,OpenAI公司发布其研发的生成式人工智能大模型chatGPT。它的出现标志着自然语言理解技术迈上了新台阶,理解能力、语言组织能力、持续学习能力更强,也标志着人工智能生成内容在语言领域取得了新进展,生成内容的范围、有效性、准确度大幅提升。
随后,世界各大科技公司都陆续发布了自己的大模型。百度公司的“文心一言”便是其中之一。“文心一言”还在内测阶段时,我就第一时间发送了参与内测的申请。
今年7月10日,距离“文心一言”全面向大众开放还有几个月的时候,百度终于向我发送了内测版“文心一言”的安装包,我比大多数人抢先体验了“文心一言”,此前也通过镜像网站体验过chatGPT,以下是我的使用体验与思考。
文心一言已经具备了很强的智能性。
在智能性方面,我分以下几个方面对它进行了考察。
1. 明显“不符合逻辑”的搞怪问题,文心一言的回答表现比较出色,总体上看似乎与GPT4旗鼓相当,明显优于GPT3.5。
就拿图1“陨石坑问题”来说,这是测试AI的经典问题。我们人类一看就知道“陨石”是“陨石坑”的成因,问题把因果倒置了。而文心一言第一段句话就说明了这一点,说明他它的智能性非常好。图2 中它的回答也相当完美。
当然,对于这类钓鱼问题,它也有偶尔失误的时候,如图3。
2. 文心一言可以理解用户对它的特殊需求,可以进行“角色扮演”,但始终认为自己就是“文心一言”而不是用户想让他扮演的人物,表现一般。
比如在图4中,我要求其扮演一个名叫“蔡徐坤”的角色,此外我还要求它扮演了很多其他角色,但每当我问及“你是谁”时,它的回答不是我要求其扮演的角色,而总是“文心一言”。
但在角色扮演中其他方面,“文心一言”的回答都还可以,可以基本满足要求。
接下来是对“文心一言”知识储备的测试。
理论上,“文心一言”的学习语料库应当是整个中文互联网甚至包含外网,在搜索引擎上能搜到的内容应当都是“文心一言”的知识储备。在知识储备方面我也问了“文心一言”很多问题,涉及高校、文学、学术等,表现都十分出色。唯一表现不足的是对于社会实时热点的解读,我想这是因为语料库的延时性造成的,喂给它的东西至少是几个月前的,它不清楚现在发生了什么可以理解。
文心一言的“学科素养”十分惊人。
我们现在是学生,因此我把文心一言当做学生考察。
语文方面,它可以写命题/自拟题目的作文、自我介绍;
数学,不超过高中难度的数学题目它基本都可以解决;
它可以写很出色的英语作文;
可以完美规划自驾旅游线路,并推荐住宿美食;
可以写诗绘画,艺术素养也可以;
甚至也能直接帮我写计算机代码,目前我测试了C++和Python语言,其代码都可以正确运行。
因此,对于学生来说,文心一言或者同类生成式人工智能绝对是革命性的工具,对于上班族来说这也绝对是颠覆性的。这也是为什么chatGPT一经问世就轰动了全球。
那么,既然chatGPT这么好,我们国家为什么禁止使用chatGPT呢?
我想这又可能有几点原因。
一是隐私问题。如果开放使用chatGPT,OpenAI公司就有能力知道我们与chatGPT进行的每一句对话,这会造成怎样的后果是未知的。出于谨慎,也为了保护我国公民的隐私,我国禁用chatGPT。
其次,chatGPT使用的的语料与文心一言不一样,这会造成其回答中表现或暗含的价值观与我们的AI不同,甚至与我们相悖,我们禁止使用chatGPT甚至禁止翻墙上外网都是因为如此,这是意识形态领域的斗争。
还有,人工智能生成的答案有不确定性,其回答出正确答案并不是必然的,可能只是“大概率”的,因此使用chatGPT的风险也是未知的。
最后,我想说,我们应当合理使用此类AI。如果研究人员都用AI写论文、艺术家都依赖AI创作、学生都用AI应付作业,AI的输入和输出形成了闭环,这个世界就乱套了。因此我们要有节制地合理使用AI,让AI成为我们的生产力工具,让我们的生活更加便捷,而不是让生活困于AI的牢笼之下。