□ 本报记者 程晓琳 张宣
ChatGPT一夜火遍全球,以简单的语言聊天交互形式吸引大量普通用户。当下,以ChatGPT为代表的人工智能大模型领域日新月异、硝烟渐起,国内越来越多的企业竞相加入战局,发布新产品、成立新公司,参与激烈的全球竞争。人工智能热潮涌动,国内互联网厂商能否突出重围?
“百模大战”已开启
4月18日,百度、字节跳动、金山办公等6家头部企业同时发布关于大模型的重要消息。百度“文心一言”大模型全面应用内部智能工作平台“如流”;钉钉宣布正式接入阿里巴巴“通义千问”大模型测试;字节跳动旗下火山引擎发布自研DPU(数据处理单元)芯片、大模型训练云平台等;金山办公宣布将推出具备大语言模型能力的生成式人工智能应用——WPS AI;APUS在北京推出1000亿个参数、自研多模态的天燕大模型AiLMe,以及基于其技术的7款AI消费端应用App;斑马智行宣布接入“通义千问”大模型测试,智己汽车成为首个上车品牌。
国内群雄争霸剑指何方?多家头部大厂在发布会上给出相似的答案:利用类GPT技术,让产品变得更“聪明”。
“之前选择云厂商更多看算力、存储等基础云服务;未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。”记者从百度获悉,“文心一言”是百度继“文心一格”之后推出的新一代大语言模型,在继承文心大模型“知识增强”“产业级”等核心特性的同时,延续“降低应用门槛”的发展路线。“文心一言”将通过百度智能云对外提供服务,根本改变云计算市场的游戏规则,“这一趋势下,百度‘云智一体’将为产业带来AI普惠,同时收获更高的云计算市场份额,云服务将从数字时代跃迁至智能时代。”
如何用大模型赋能实体经济?以“文心一言”大模型为例,其将支持更多企业构建自己的模型和应用,赋能交通、能源、制造等实体经济领域,提升生产效能。例如,Apollo将“文心一言”融入智能汽车,让智能汽车不仅有“智商”还有“情商”,“可以说,汽车机器人将首次拥有人格,我们描述一辆汽车,不再是冷冰冰的参数,而是‘温柔、贴心’甚至‘高冷’这样的形容。”
钉钉接入阿里巴巴“通义千问”大模型,用一条斜杠完成了进化。根据现场演示,用户只需在对话框里输入“/”,便可以唤起10多项能力,完成内容生成、摘要提取、应用开发等诸多工作。阿里云相关负责人表示,“通义千问”是阿里云推出的类ChatGPT大模型,其基于阿里巴巴达摩院“通义”大模型技术研发,在文本理解、文本生成、多轮对话等大语言模型(LLM)基础能力方面表现突出,并正在以周为单位进行优化迭代。“今后,阿里所有产品将接入‘通义千问’进行全面改造,钉钉、天猫精灵率先接入测试,将在评估认证后正式发布新功能。”
各自修炼“看家本领”
ChatGPT、Bard、“文心一言”背后的关键技术都是大模型。业内专家认为,动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠简单堆积GPU就能实现的,这是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要AI-云计算的全栈技术能力。
大模型好不好用到底取决于什么?工信部语言信息智能处理及应用重点实验室副主任、江苏省人工智能学会模式识别专业委员会委员、南京理工大学教授夏睿告诉记者,预训练语言模型的基本技术架构包括编码器、解码器和编解码一体化3种。国产大模型大多建立在上述架构之上,结合各家前期积累,各有特色。目前看来,不同架构对于大模型能力的影响并非最大,相比而言,语料的规模及质量、代码数据的有效利用、人类反馈的设计使用以及大规模数据的训练技巧,是决定大模型性能的更关键因素。
阿里相关负责人表示,阿里巴巴达摩院在NLP(自然语言处理)等前沿科研领域布局多年的基础上,于2019年启动大模型研发。2021年,阿里先后发布国内首个超百亿参数的多模态大模型M6及语言大模型PLUG;同年8月,阿里大模型在全球机器视觉问答榜单VQA上首超人类得分;2022年2月,M6实现可同时完成10余项单模态及多模态任务,最大程度打通了AI感官;2022年9月,阿里发布集成历年技术沉淀的“通义”大模型系列,相关核心模型和技术通过魔搭社区开源开放,为国内大模型发展提供一臂之力。
近日,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于“通义千问”完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。同时,中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业向阿里云提出合作意愿,将与阿里云在大模型相关场景展开技术合作的探索和共创。
“百度之所以能快速推出‘文心一言’,是因为深度学习、自然语言处理、语言大模型等技术都是‘原产’的,可以说,百度为此积累了20年。”百度表示,百度扎根搜索的核心技术——自然语言理解,并基于搜索引擎,演化出语音、图像、知识图谱、自然语言处理等人工智能技术,“百度在人工智能的四层架构中,有全栈布局,包括底层的芯片、飞桨深度学习框架、大模型以及最上层的搜索等应用。而ChatGPT、‘文心一言’类技术位于模型层。”
2022年是大模型产业化应用元年,大模型成为许多上层应用的技术底座。而百度“文心”已经累计发布11个行业大模型,并以“知识增强”为核心,实现从单模态大模型到跨模态、从通用基础大模型到跨领域、跨行业模型,持续突破和创新。
“每天,文心大模型服务数十亿次用户搜索请求,在中文语言样本训练上具有先天优势。”百度介绍,文心大模型具备中文领域最先进的自然语言处理能力,其先进性不仅体现为对中文语言的理解,还体现为对中国文化的理解,从而更适合中国市场。
目前,国产大模型奋起直追,百花渐次开放。但在基础理论、标注数据、芯片算力等方面与国际顶尖技术相比还存在一定差距。夏睿解释,“OpenAI在GPT系列模型、强化学习算法、自动编程等领域积累了大量先进技术,具有丰富的数据资源和算力支持,以及多领域的应用经验,同时还在不断研发新型大模型版本,因此难以在短时间内赶超。”但他也表示,近几年我国自然语言处理技术进步很快,“我们也不宜妄自菲薄,在追赶过程中,需要给国产大模型一些时间。”
夏睿告诉记者,人工智能领域从“0”到“1”的原创性、颠覆性创新,如Transformer、预训练语言模型、ChatGPT等,多数源于国际顶尖互联网科技公司,而我国人工智能技术更擅长从“1”到“N”,处于跟随地位,创新模式以应用创新、集成创新为主。“大模型依赖高质量的标注数据,中英文优质语料方面存在较大差距。”他认为,我国需要加强构建涵盖多个领域和类型,更丰富、更优质的数据资源和标注规范。同时,强大的算力是构建大模型的基础,目前大模型算力主要由GPU支撑,而芯片领域的问题也在一定程度上限制和延缓了我国大模型技术的发展。
大模型的未来发展路径
人类获取知识的方式有视觉、语言、听觉等,它们在人脑中汇聚,将输入的不同形式内容贯通起来。因此,许多业内专家认为,未来多模态大模型需要做到多模态的信息在高维空间实现有机融合。
“‘通义千问’既不是起点也不是终点,而是既定路线上的一个节点。”阿里云智能CTO周靖人表示,阿里还处在不断探索基于多模态大模型的路径上,未来需要进一步突破创新。比如,如何把各个模态的模型能力融入同一个模型,是大模型探索过程中很重大的一项挑战。
2022年,阿里云在业界首次提出“Model as a Service”(MaaS,模型即服务)概念,并联合生态伙伴联合推出国内首个“模型即服务”开放平台魔搭社区,汇集行业领先的预训练模型,减少开发者的重复研发成本。目前,魔搭社区已与10多家顶尖人工智能机构合作,以开源的方式提供超1600个优质模型,汇集行业和学术热门的公开数据集以及相关专业领域数据集。
“AI开发的门槛会越来越低,我们希望,未来连小学生也能开发自己想要的模型,为此需要打造新的开发范式。一方面,我们认为MaaS是未来人工智能发展的重要方向,或将促进AI产业界的大发展;另一方面,MaaS对基础设施提出新要求,特别是和云计算基础设施的深度融合,也带来新的AI工具的机会。”周靖人说。
基础研究是重大原始创新、颠覆性技术、现象级产品的源泉,但同时又存在周期长、难度大、风险高等现实问题。夏睿认为,从事基础研究不能过于急功近利,OpenAI团队以追求通用人工智能为理念,不因KPI和短期利益影响和否定发展路线,持续积累创新,最终才获得ChatGPT的成功。“国内也需要一批有理想有情怀的科研人员,更需要营造鼓励基础科研、保障潜心致研的科研生态。”
未来,国内通用人工智能如何发展?夏睿分析,一方面,ChatGPT是通往通用人工智能目前最可能的一条路径,但不是唯一途径。他表示,目前大模型主要基于连接主义,具有过度依赖数据、缺乏解释性、难以逻辑推理等缺点,“需要引入符号主义,发展具有可解释性的、可信和安全的人工智能。”
另一方面,大模型技术本身存在的问题需要逐个击破。夏睿举例说,包括大模型涌现能力原理的揭示、大模型生成内容的事实正确性、大模型与真实物理世界的交互性、大模型的压缩与轻量化、大模型实时性学习、细分专业领域的知识获取与推理、大模型性能评估体系等。
企业根据独特行业场景训练专属GPT产品,是GPT发展的又一“未来式”。据悉,阿里将开放“通义千问”的能力,企业在阿里云上既可以调用“通义千问”的全部能力,也可以结合行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等,而阿里云将提供完备的算力和大模型基础设施,实现“个性化生长”。