智东西
作者 | 云鹏
编辑 | 心缘
智东西8月16日报道,刚刚在WAVE SUMMIT深度学习开发者大会2023上,包括百度首席技术官王海峰在内的多位百度高管登台演讲并发布了一系列新技术和产品,对于大模型对人工智能产业发展的意义,王海峰进行了重点解读。
百度飞桨和文心大模型两大百度核心产品业务也掏出了其在深度学习与大模型领域的技术进展和开发者生态成果。
在王海峰看来,实现通用人工智能,理解、生成、逻辑和记忆这四个能力是最关键的,而大语言模型恰恰增强了人工智能的这些能力,大语言模型为通用人工智能带来了曙光。
文心一言开放测试已经有5个月时间,在工作、生产、生活几个关键场景中落地,文心一言可以帮用户准备简历、查找岗位、进行项目管理、进行旅游规划。
百度副总裁吴甜提到,文心一言已经可以覆盖200多个创作体裁,知识点覆盖提升了8.3倍,思维链长度提升了2.1倍。
值得一提的是,今天百度副总裁、百度首席信息官李莹在会上发布了基于文心一言的“超级助理”,可以帮助用户制定会议日程安排、订机票酒店、查找手机上的文档,类似“文心一言版”智能语音助手。
在国内百模、千模大战的背景下,百度是在AI大模型领域走的较快的一家,因此也受到业内较多关注。如何解决AI大模型落地产业的过程中遇到的真实挑战,也是所有AI大模型企业关注的焦点。
一、王海峰:实现通用人工智能,AI的理解、生成、逻辑、记忆能力是关键
今天,百度首席技术官王海峰率先登台进行了演讲,他也是深度学习技术及应用国家工程研究中心主任。
以大语言模型为代表的人工智能技术在过去一段时间里发展迅速,通用人工智能的到来迎来曙光。
在王海峰看来,现在人工智能已经具备了很强的通用性,而深度学习技术和大模型技术是推动这一趋势的关键,人工智能开始进入工业大生产阶段。
王海峰重点提到了飞桨和文心大模型,去年百度文心发布了11个行业大模型,文心一言则是文心大模型家族里的大语言模型。
标准化降低了人工智能应用的门槛,自动化则降低了应用成本,模块化则加速人工智能支持更广泛的场景。
目前有22万家企业在使用飞桨和文心,开发者超过800万人。
在王海峰看来,实现通用人工智能,理解、生成、逻辑和记忆这四个能力是最关键的,也是通用人工智能最基本的能力。
知识增强大语言模型是让人工智能获得这些能力的关键,文心一言就是这样一种大模型。知识增强、检索增强、对话增强等能力都比较重要。
为此,百度重点提升了文心一言的基础通用能力,对其进行自然语言与形式语言的训练,自然语言训练侧重“思考”,代码这种形式语言侧重“执行”。
在知识增强方面,百度目前有5500亿知识的知识图谱,百度用知识图谱构建数据,将数据用于模型的训练。
百度将知识增强和检索增强结合,进行知识点增强,让大语言模型可以有更好的生成效果。此外,百度也在提升大模型的逻辑能力。
王海峰特别提到,飞桨和文心,一个是框架,一个是模型,两者的协同优化非常重要,通过两者协同,百度将模型的推理性能提升了30多倍。
大模型有了,怎么把它用的更好是一个很关键的问题,针对场景的适配、协同优化很关键。同时,插件也可以给大模型的能力有一个比较好地扩展。
王海峰最后总结到,现在人工智能具有更好的理解、生成、逻辑和记忆能力,也开始在千行百业中更好地进行赋能,大语言模型为通用人工智能带来曙光。
二、文心一言落地工作、生产、生活,大模型社区开发项目超600万个
百度集团副总裁吴甜随后登台进了演讲并发布了文心一言相关新技术、能力。
文心一言开放测试已经有5个月时间,在工作、生产、生活几个关键场景中,均已有代表性落地案例出现。
在工作场景中,文心一言可以帮用户准备简历、查找岗位、准备面试、做职业规划;文心一言还可以帮用户进行项目管理,包括项目分工、启动会筹备、启动邮件准备。
生活方面,文心一言可以针对用户冰箱里的食材,针对性地设计食谱,在用户旅行中可以规划路线、撰写旅行分享文案。
发布至今,文心一言可以覆盖200多个创作体裁,知识点覆盖提升了8.3倍,思维链长度提升了2.1倍。
目前文心一言已经支持了多类原生插件,包括搜索、文档阅览、图片生成、文字生成视频等功能类型。
在现场演示过程中,用户给文心一言一份文档,文心一言可以调用插件总结出文档中的关键信息,用户还可以根据这些信息进一步询问文档中的相关数据,并让文心一言调用插件直接根据这些数据生成图表。
用户在给文心一言输入一张图片后,文心一言可以调用插件对图片进行理解,并根据图片信息创作“品牌名称”。在写完品牌名称后,文心一言可以进一步创作广告语、根据广告语制作品牌宣传视频。
上述这一系列过程,在传统工作流程中通常会消耗几天或数周,但文心一言可以在几分钟内完成。
在代码能力方面,用户可以直接把难懂的代码扔给文心一言,文心一言可以对代码进行通俗易懂的解读,告诉用户这些代码是在做什么,同时文心一言可以将这段代码以更简洁的方式改写。
改写后,文心一言可以给出测试用例,并在测试后给出结果。接着,文心一言可以根据此前的函数生成一个词云的相关代码。
最后吴甜提到了文心对开发者的相关赋能。吴甜说,AI Studio星河大模型社区已经是目前国内最大的大模型开发社区,可以让开发者开发大模型相关应用更简单,目前开发项目约为609万个。
在插件方面,文心一言给开发者提供了插件统一开发范式及工具集。会上,吴甜还公布了文心大模型“星河”共创计划。
三、大模型推理速度提升30多倍,飞桨“黑科技”成关键支撑,首发“超级助理”
关于百度飞桨,百度AI技术生态总经理马艳军登台发布了飞桨开源框架v2.5,其在基础框架、大模型训练、大模型推理、硬件适配等方面进行了升级。
基础框架升级方面,百度让性能优化变得更通用,重点优化了神经网络编译器CINN,典型模型训练性能领先同类产品20%。
在功能层面,高阶自动微分是目前非常受关注的,在这一方面,百度将开发接口进行动静统一,对代码进行了精简。
马艳军特别提到,飞桨对大模型的训练起着关键的支撑作用,包括提升有效训练时间占比、提升训练吞吐速度、提升收敛效率,这些环节涉及硬件集群协同优化、芯片存储/网络协同优化、模型算法协同优化。
在模型压缩方面,飞桨减少了量化损失,提升模型效果;在最后的服务部署方面,飞桨推出了动态插入用户请求的相关技术,提升调度效率。
马艳军说,在一系列技术优化的基础上,文心大模型的推理速度提升了30多倍。
在大模型适配更多硬件方面,目前飞桨与12家硬件伙伴开展了文心大模型适配,和25家硬件伙伴联合建设AI Studio硬件生态专区。从现场演示中可以看到,硬件适配合作伙伴中有英伟达、英特尔、高通、联发科、中科曙光、华为等企业。
今天百度副总裁、百度首席信息官李莹在会上发布了基于文心一言的超级助理,在百度看来,懂你、专业、实时陪伴是其三个核心的优势特性。
会上,根据百度演示,超级助理可以帮助用户制定会议日程安排、制定旅游规划,在进行旅游规划时,超级助理可以直接订机票、订酒店。最后在文档处理方面,超级助理可以帮用户查文档、学习专业知识。
整体来看,超级助理跟文心一言的能力是比较接近的。
今天,百度还发布了Baidu Comate X代码工具,目前支持30多种语言以及十余种IDE。
结语:大模型能力迭代加速,通用人工智能更近一步
不论是百度飞桨还是文心一言的技术升级、能力提升,其核心目的都是要提升大模型在产业中实际应用的效果,真正为千行百业带来大模型应有的价值。
随着大模型在产业场景中找到更多的结合点,能否解决客户问题成为最关键的问题。因此,更智能的算力、灵活的框架平台、丰富的大模型体系以及优质的应用方案,都将成为企业决胜“千模大战”的关键。
在国产大模型加速赛跑的同时,国外的微软、亚马逊的AI竞赛同样愈演愈烈。正如王海峰所说,大模型给通用人工智能发展带来了新的机遇。生成式AI已成为当下AI领域的一个兵变必争之地,技术的产业化落地和商业应用将成为决胜关键。