北京时间 2 月 7 日凌晨,谷歌 CEO 桑达尔·皮查伊(Sundar Pichai)宣布,谷歌将推出一款由 LaMDA 模型支持的对话式人工智能服务,名为 Bard。
(来源:Google)
皮查伊称这是“谷歌人工智能旅途上的重要下一步”。
他在博客文章中介绍称:Bard 寻求将世界知识的广度与大型语言模型的力量、智慧和创造力相结合。它将利用来自网络的信息来提供新鲜的、高质量的回复。它既是创造力的输出口,也是好奇心的发射台。
他还表示,Bard 的使用资格将首先“发放给受信任的测试人员,然后在未来几周内开放给更广泛的公众”。虽然具体时间尚未公布,但考虑到谷歌目前的处境,或许不需要很久我们就能一睹为快。
与此同时,皮查伊还宣布谷歌搜索引擎将加入更多新的人工智能(AI)功能和服务。“人类的许多问题是主观且没有正确答案的,AI 可以在这些时候提供帮助和综合见解……将复杂的信息和多个视角提炼成易于理解的形式,以便用户快速了解全局并从网上获得更多信息,”他写道。
虽然没有指名道姓,但 Bard 对话式 AI 服务的定位,很明显是谷歌为了应对 OpenAI 的 ChatGPT 而推出的竞争产品,而在搜索引擎中加入更多的、更强大的 AI 功能,也是为了对抗可能很快到来的、在 AI 技术(很可能是 ChatGPT)加持下的微软必应搜索引擎。
ChatGPT 是 OpenAI 在 2022 年 11 月推出的对话式人工智能机器人,以惊人的对话表现和高质量的输出内容引爆网络,甚至以一己之力彻底带火了人工智能生成内容(AIGC)的赛道,让微软、谷歌等公司纷纷在相关领域加注。最新统计数据显示,ChatGPT 推出不到 2 个月,月活用户数量就已超过 1 亿,而短视频杀手级应用 TikTok 用了 9 个月才实现这一目标。
根据描述,Bard 的工作方式大概率与 ChatGPT 类似,都是通过对话来回答用户的问题或者提供用户想要的信息,用户可以不断地追问、改进、丰富自己的问题,让 AI 的回答更贴近自己想要的东西。
在介绍 Bard 时,谷歌使用的案例是“用 9 岁小孩可以听懂的话,介绍一下詹姆斯韦伯太空望远镜的最新发现”。这是一个复杂的话题,而谷歌要展示的能力是用 Bard 简化它。
Bard 给出的回应列出了三个最新发现,段落清晰,用词简单,还使用了比喻让内容更易理解,而且在对 9 岁小孩可能没掌握的词根“Exo”加以注释,可以说是理解力和解释力双满分。
图 | Bard 介绍詹姆斯韦伯太空望远镜的最新发现(来源:谷歌)
根据介绍,最初发布的 Bard 服务,将使用轻量级 LaMDA 模型。从执行任务的角度来看,轻量级模型将需要更少的算力,从而让谷歌可以扩展和服务更多的用户。
目前还不清楚 Bard 将使用多么“轻量级”的 LaMDA 模型。LaMDA 模型的全名是 Language Model for Dialogue Applications(对话应用的语言模型),最早在 2021 年的谷歌 I/O 大会上公布,后于 2022 年更新为第二代。它基于 Transformer 神经网络架构,使用高达 1370 亿个参数进行训练,它的训练数据是对话内容,而非普通的句子和文章。
经过多年的打磨和实践,LaMDA 模型的强大是毋庸置疑的。2022 年 6 月,谷歌 AI 工程师 Blake Lemoine 甚至公开表示,他认为 LaMDA 已经有了人格意识,具有相当于八岁儿童的智力。此番言论被谷歌和许多从业者认为是证据不足,也导致该工程师被带薪休假,但这也反应出模型确实具有很强的对话技巧。
谷歌表示,在用户使用 Bard 时,他们将会收集外部反馈并与内部测试相结合,以确保“Bard 的回答在质量、安全性和根基性(真实性)等关键方面达到高标准”。值得注意的是,这三点正是谷歌研究人员在 LaMDA 模型中最看重的三个核心目标。
这一点与 OpenAI 对 ChatGPT 所做的类似。自推出以来,OpenAI 已经对 ChatGPT 进行了多次大大小小的更新,包括对问题接受程度的提高,对回答质量的改进,产品功能性优化和数学能力强化等等。不仅如此,OpenAI 还推出了付费版 ChatGPT,ChatGPT Plus 服务,包括更快的响应速度和提前体验未来的新功能。
图 | ChatGPT 的更新日志(来源:OpenAI)
可以预见的是,Bard 上线之后,谷歌可能也会不断推出更新和优化,比如参数更多的 LaMDA 模型,甚至是类似的订阅制服务。
毕竟在动荡不安的宏观经济环境下,科技巨头们已经陆续裁员。接下来我们很可能看到,投入长期人工智能研究的资金减少,同时让相关技术产生经济利益的压力增大。企业实验室的研究人员将面临更大压力,以证明他们的研究成果可以整合到产品中,从而为企业赚钱。
可以说,Bard 将成为谷歌的一款产品。在此基础上,谷歌还将开放同样由 LaMDA 模型驱动的生成式语言 API(Generative Language API),供第三方开发者和企业使用,从而推动更多创新。API 服务预计将在下个月开放,同时皮查伊也表示,谷歌会开放更多的 AI 模型驱动的 API 并开发配套工具。
“重要的是,我们要以大胆和负责任的方式,将根植于这些(人工智能)模型里的经验带给整个世界。所以我们致力于负责任地开发人工智能,”皮查伊写道,“无论是应用 AI 彻底改造我们自己的产品,还是让其他人可以使用这些强大的工具,我们都将继续大胆创新,并用我们的方法负责。这仅仅是个开始——在接下来的几周和几个月里,所有这些(产品)领域都会看到更多更新。”
图 | 谷歌展示人工智能如何改善搜索结果(来源:谷歌)
“红色代码”
早在 2019 年和 2021 年,微软就曾投资 OpenAI。ChatGPT 推出后,微软很快就宣布了对 OpenAI 进行“持续多年、数十亿美元”规模的投资,以拓展两家公司的合作伙伴关系。此后,有关微软要将以 ChatGPT 为代表的 AI 技术与旗下多款产品深度整合的消息层出不穷。
正所谓“近水楼台先得月”,ChatGPT 再开放,与其他企业的合作再深入,也不会比与“金主”微软的合作更早、更快、更深入。一个最明显的例子:被谷歌搜索牢牢压制的必应搜索引擎或许会因此焕发新生。
微软当然不会放过这个好机会,就在皮查伊官宣 Bard 之后,微软很快就表示要在周二(美国时间 2 月 7 号)召开一场发布会,我们可以期待看到更具体的、由人工智能驱动的产品更新——这甚至早于谷歌原定于周三在巴黎召开的有关搜索引擎的发布会。
同样也是在皮查伊官宣 Bard 之后,已有媒体表示获得了一份谷歌内部备忘录,也是由他发布的。
据称,内部备忘录号召所有谷歌内部员工,以“参加 Hackathon(编程马拉松)的态度”齐心协力测试 Bard,踊跃提供反馈和建议,因为“(该服务)现在还处于早期阶段,需要快速迭代”。皮查伊还表示,谷歌将很快开始招募开发人员和企业,来测试前文提到的、基于 LaMDA 的 API。
所有这些行动,一方面显示出谷歌、微软等科技巨头对 AIGC 技术的高度重视,另一方面也凸显出他们的行事高效和技术上的积累——距离 ChatGPT 推出还不到 3 个月,再算上圣诞假期季谷歌就已经能拿出与之竞争的产品,而微软也打算成为“第一个吃螃蟹”的企业。
(来源:Pixabay)
生成式人工智能的未来
2022 年,我们看到了许多生成式人工智能技术的爆火。未来,我们一定会见证更多技术的诞生。
OpenAI 的 DALL-E 2 模型在 2022 年 4 月发布。5 月,谷歌官宣了(但没有发布)它自己的两种文本到图像的模型,Imagen 和 Parti。然后是 Midjourney 公司,推出了一个为艺术家制作的文本到图像模型。8 月,英国初创公司 Stability AI 向公众免费发布了开源模型 Stable Diffusion。11 月,我们看到了 ChatGPT。
尝鲜的用户蜂拥而至。OpenAI 在短短 2 个半月内就吸引了 100 万用户。超过 100 万人开始通过付费服务 Dream Studio 使用 Stable Diffusion;更多的人通过第三方应用程序使用 Stable Diffusion,或在他们自己的电脑上安装免费版本。Stability AI 的创始人易马德·莫斯塔克(Emad Mostaque)表示,他的目标是拥有 10 亿用户。
在 2022 年 10 月,我们看到了第二轮热潮:谷歌、Meta 等公司发布了文本到视频模型,可以创建短视频、动画和 3D 图像。
这种发展速度令人惊讶。在短短几个月的时间里,这项技术登上了媒体头条和杂志封面,社交媒体上到处都是讨论的人和有关的梗,话题的热度高居不下,但同时也引发了强烈的反弹。
伦敦国王学院研究计算创造力的人工智能研究员迈克·库克(Mike Cook)说:“这项技术令人惊叹——它很有趣,这是新技术该有的样子。但它发展得如此之快,以至于在你的理解根本赶不上它的更新速度。我认为,整个社会要花上一段时间来消化它。”
尽管一些人仍沉浸在震惊之中,但更多人正在寻找使用这些工具的方法,并预测接下来会发生什么。
从文本到图像的模型可能只是一个开始。生成式人工智能最终可能被用于建筑设计和开发之中,这又被称为“文本到 X(图片之外的某种事物)”。人们会意识到,技术或工艺不再是障碍,唯一的限制是他们的想象力。
令人兴奋的事实是,我们不知道接下来会发生什么。原因是,虽然创意产业——从娱乐媒体到时尚、建筑、市场营销等等——将首先感受到影响,但这项技术将把创造力赋予每个人。从长远来看,它可以用于产生几乎任何东西的设计,从新型药物到服装和建筑。
生成式人工智能的未来已经拉开帷幕,面对翻天覆地的变化,科技巨头已经给我们展示了正确的对待方式:用一切可能的资源去拥抱它,而不是固步自封。