出品 | 搜狐科技
作者 | 梁昌均
从3月16日到8月17日,过去150天后,百度文心一言再次迎来进化。在昨日的WAVE SUMMIT深度学习开发者大会上,文心一言获得多项能力加持,并推出多项应用进展。
具体来看,在基座模型升级到文心3.5的基础上,文心一言此次推出五个原生插件,以此扩展大模型能力边界,这也是ChatGPT所采取的方式。同时,文心也和国内最大的深度学习框架飞桨加速融合。
此外,文心一言也落地到和广大用户密切相关的办公场景,发布百度如流超级助理,这一领域已经成为微软、谷歌、阿里等国内外巨头争先抢占的应用高地。
百度CTO、深度学习技术及应用国家工程研究中心主任王海峰在当日的演讲中表示,理解、生成、逻辑、记忆是AI的核心基础能力,这四项能力越强,越接近通用人工智能。“大语言模型具备了这四项能力,为通用人工智能带来曙光。”
但对百度文心一言而言,在看到曙光前,如何持续提升自身能力的同时,实现规模落地、打造生态也同样重要。
文心一言新增五大插件,多模态能力增强
今年3月16日,百度在国内率先发布类ChatGPT产品文心一言,并持续优化。此次发布的五个原生插件就进一步拓展了它的能力。
这五个插件包括百度搜索、览卷文档、E言易图、说图解画、一镜流影,使模型具备生成实时准信息、长文本摘要问答、数据洞察和图表制作、图片创作和问答、文生视频等能力,多模态能力的提升成为重心。
不同于最初发布时的视频录制,这次文心一言显得更有底气,百度副总裁吴甜现场演示了这些插件的功能。比如在牛奶品牌的演示中,文心一言借助览卷文档、E言易图、一镜流影等插件,在不到5分钟的时间里,就完成从市场调研、图表分析,到品牌构建、视频广告的全部流程。
从输出的23秒的视频效果来看,有画面、有配音,主旨也比较清晰。“如果不借助AI,完成这些流程需要几天时间。”吴甜表示,文心一言可以支持一次同时使用3个插件,不但扩展了大模型能力边界,也更适应场景需要。
搜狐科技注意到,目前文心一言对话界面已出现四个插件选项,其中百度搜索为默认选项,暂不支持关闭。但由于视频生成能力占用算力较大,一镜流影目前还没有对外开放,仅为邀请内测。
吴甜在与搜狐科技等媒体对话时表示,这些插件都是百度自己开发,原因是想先把开发的过程走一遍,走通之后再开放给开发者。
“插件和插件之间也可以协同,可以让大模型更好地去理解和调度,这需要我们先行把相应的建设做得比较完备。”吴甜说。不过,相较ChatGPT目前已过百的插件生态,文心一言落后明显。
吴甜还介绍称,目前文心一言熟练掌握的创作体裁超过200种,涵盖了几乎所有写作需求,内容丰富度是初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖是初期的8.3倍。
这些能力提升的背后的技术的持续进化。吴甜认为,这其中最为重要的就是基础模型的升级,文心一言的基座已从文心3.0升级到3.5版本,使得文心一言的整体能力有所提升。
在数据层面,新版本通过优化数据源及数据分布等提升训练效果,并运用了长文建模、多类型多阶段有监督精调,以及在检索增强和知识增强基础之上融合知识点增强,提升了基础通用能力。
“文心一言的测试使用,包括在百度自身业务场景和产品的落地,这些使用反馈也反过来进一步加强了对文心自身能力的建设。”吴甜表示。此外,通过和飞桨的协同优化,文心大模型训练速度达到原来的3倍,推理速度达到30多倍,也使得文心一言的能力得到提升。
“要把大模型变得越来越好,需要时间,需要更强劲的算力,更好的数据,尤其是更多优质和权威的数据,模型算法本身也需要持续去优化。”吴甜说,“我对技术从来都没有满意过,当前的大模型能力也仍有很大提升空间。”
具体到文心一言而言,她认为距离终极目标还有很长的路要走,下阶段最重要的提升大模型逻辑性,推动其和大量应用结合的更加顺畅,带来更大价值,并在更大范围联合建设生态。
落地办公场景,大模型生态建设时机已到
自文心一言发布以来,百度也在推动其应用,除落地自身的搜索、小度、网盘、智能驾驶等业务外,最主要的动作便是将把文心一言等大模型能力和服务放到云上,推出企业级大模型生产平台千帆大模型,让企业可以基于此去构建自己的大模型应用。
就在不久前,千帆大模型还接入LLaMA2全系列、ChatGLM2、RWKV、MPT等33个开源的大模型,成为国内拥有大模型最多的平台,满足企业更多的需求和选择。
在昨日的发布会上,百度又将文心一言的能力落地到办公领域。百度副总裁、首席信息官李莹发布了百度如流超级助理。“助手意味着更多的工具属性,升级到助理,意味着更多的人性化和主动性,甚至能主动去做规划。”
现场李莹围绕移动端任务执行、智能文档处理、CBI会话式商业智能、智能沟通等四大场景,对超级助理进行了演示。比如语音输入“我后天上午去上海开会,当天返回北京,请帮我规划行程”,超级助理的一键差旅就能提交自动差旅申请,自主规划行程,并预定往返机票和酒店,数秒就可以完成,不需要自己去费时费力地查询预定。
李莹在接受搜狐科技等媒体采访时表示,有了文心加持的超级助理,工作的交互方式会变成以自然语言为主,并可以实现端到端的极致满足,同时也会重塑工作流程和工作模式,带来全新的工作范式和生产效率的提升。
不过,百度显然不会独乐乐,其也意图通过生态共建的方式推动文心大模型的应用落地。目前飞桨平台已凝聚800万开发者,服务22万家企事业单位,基于飞桨创建了80万个模型。相较去年底,开发者数量增加超过250万,飞桨和文心的融合起到不少拉动作用。
飞桨还专门推出了AI开发者社区AI Studio(星河社区),已凝聚609万个开发项目,积累超300个大模型创意应用。吴甜表示,百度也会向生态开发插件,让更多的开发者来开发插件。
“建设大模型生态最重要的是技术本身的完备性、成熟性以及依托生态的产品力。”吴甜在对话中表示,大模型历经了半年的热潮后,整个行业的角色分工逐渐越来越明朗化,无论从行业环境还是从文心自身来看,现在已经到了建设生态非常好的时机。
在吴甜看来,人工智能带来的产业升级是一个非常复杂的链条,不是一家公司就能够做完所有事情,需要上下游一起努力。生态就是大家拉起手来,从基础平台,到软硬件,能够抱团建设,然后再去应用发展,包括推动人才转型,最终实现整个产业转型。
“生态在这个过程中非常重要,最大的作用就是会让应用更加繁荣,让企业应用落地以及产业升级更快速。”吴甜说。
文心加飞桨,翩然赴星河,共赴通用人工智能的星辰大海。这是百度飞桨打造大模型生态的愿景,但生态的建设也绝非易事,涉及到各方利益的分配,也需要长时间的积累。