继微软发布了集成ChatGPT的新版必应,开始试图挑战谷歌在搜索引擎领域的市场领导地位后,谷歌为对抗ChatGPT,也针锋相对的拿出了自家的对话机器人Bard。作为大名鼎鼎机器学习开源框架TensorFlow的开发者,谷歌在AI领域显然也底蕴深厚,并且为了证明自己的技术实力更胜一筹,在宣传中更是表示Bard不仅能与ChatGPT一样做到有问必答,还要更“负责任”。
言下之意,无非就是ChatGPT的回答更“信口开河”、不太“负责任”。只可惜谷歌的这个Flag立得并不太好,Bard首次亮相就“翻车”了。由于在官方展示的动画中出现了严重的事实性错误,不仅让谷歌颜面大失,更让直接使得其股价在2月8日大跌7.4%、市值瞬间蒸发千亿美元,也创下了自2022年10月以来单日最大跌幅。
在关键产品的处子秀上,一个错误的展示案例却能通过不同部门、不同职级的层层审批,并被展现在全球数亿用户面前,这背后反应的当然是谷歌在组织与运营上出现了问题。也从侧面证明了,ChatGPT咄咄逼人的强势表现确实让谷歌方寸大乱,以至于上演了刚刚宣称自己的产品更负责,转眼就被“打脸”的剧情。如此这般,无疑才是让投资者对谷歌抱以怀疑态度的关键所在。
而让ChatGPT迅速点燃市场的,是其尤为擅长输出看上去符合逻辑、像是人话的内容,也就是“说人话”,这就让用户有真的是在与“人”、而不是“机器”交流的感觉。但对于回答本身的正确性,ChatGPT或许并不看重的。事实上,Bard的首秀“翻车”也揭露了如今热火朝天的AI对话机器人在底层上的顽疾,那就是“一本正经胡说八道”这个现象无法根除,可靠性难以得到保障。
要说在回答问题上“翻车”,ChatGPT其实更胜一筹,曾给出诸如《原神》是由腾讯开发的竞技战斗游戏、汉朝末代皇帝嬴政坑杀著名儒学家墨子、韩非子、项羽这样的回答。而谷歌Bard也不遑多让,这一次强行将第一批系外行星照片的殊荣冠给了2021年末才投入使用的詹姆斯·韦伯望远镜。所以不难发现,两者的事实性错误可以说是不胜枚举。
其实这一现象几乎不可避免,也牵扯到了ChatGPT这类对话机器人的技术原理。据悉,ChatGPT是基于GPT-3.5大规模语言模型(LLM,Large Language Model)的基础,再加入人工标注数据和强化学习技术,辅以知识图谱技术,即一种将知识写成结构化三元组(包含实体、概念和关系)的多关系图,让AI能够理解人类指令的含义,并从庞大的数据库中选择相关内容进行回答。
简单来说,也就是无论ChatGPT、还是谷歌的Bard,它能够回答用户的内容都是基于“喂”给它的数据,组成回答的形式也是从海量训练参数中排列组合出来,只是根据用户的问题以概率形式估计,并呈现最有可能出现的文字。那么,如果训练参数出现问题呢?其实数据投毒攻击(Data Poisoning Attack)已经是一个AI领域不可回避的问题。
传统的网络攻击是通过发现漏洞、再编写代码来实现,而AI领域的攻击行为则更难防备,因为给数据库贡献参数几乎是每一个AIGC平台都欢迎的行为。据相关研究人员在HITCon安全会议中透露的数据,只需“毒害”不到0.7%提交给机器学习系统的数据,就可以完全绕过防御,进而全面降低模型的准确率。
最典型的案例,就是有用户在对微软小冰等传统对话机器人进行“诱导”,通过语言实现诱使这类产品说脏话,甚至发表敏感言论的目的。以至于曾经出现过,谷歌的AI程序将YouTube上国际象棋视频中的黑棋白棋,识别成黑人白人的情况。毕竟用谎言去验证谎言得到的一定是谎言,如果数据集中的参数本身就有问题,得到的回答自然是错漏百出的。
再加上,数据投毒的成本其实远没有想象中那么高。不同于传统网络安全领域围绕漏洞挖掘的攻防,其实是沙里淘金的运气游戏,由于全球AI领域合作的紧密性以及高昂的数据成本,开源和共享极为普遍,只需要给AI模型植入恶意执行代码,再上传到开源社区,就能轻易污染大范围的数据供应链。
如果ChatGPT、Bard仅仅只是一个对话机器人,是以娱乐向为主,那么出现一本正经的胡说八道也无伤大雅,但如果像微软一般将ChatGPT集成到搜索引擎上,就有问题了。
要知道博学多才的人注定是少数中的少数,大多数人往往专精的领域十分有限,这就意味着对于非专业领域的信息求证成本很高。用户相信搜索引擎能给出他们需要的答案,但是一方面AI的回答可靠性不高,另一方面AI的回答看起来又似乎很专业,势必就会污染整个互联网的信息源。
引入科技来替代以前人类的工作,却没有能力来验证可靠性,这其实就是如今ChatGPT和Bard的致命缺陷。在将ChatGPT引入Bing之前,微软的策略相当聪明,以投资OpenAI的方式与ChatGPT保持了一定的距离,既享受到了红利、又实现了与风险隔离。如今在新版Bing中集成了ChatGPT之后,微软显然就要与谷歌一样对产出的结果承担责任。
在谷歌已经因Bard“翻车”尝到了市值一夜蒸发千亿美元的苦果后,接下来或许就要轮到微软了。