今天分享的是AI大模型专题系列深度研究报告:《AI大模型专题:2023大模型落地应用案例集》。
(报告出品方:中国信息通信研究院华东分院)
报告共计:119页
海量/完整电子版/报告下载方式:公众号《人工智能学派》
概述
私域知识问答系统是一种旨在满足特定组织或团队内部需求的智能信息获取工具。其产品形式包括:知识问答、企业助理、办公助手、智能客服、数字员工等。岩芯数通过自研构建可控可信的通用大模型,缓解了行业中大模型幻觉问题,提升型的准问答能力,回答准确率达到 90%,目前已在多家企业内部部署应用。
信息是解决问题的基础,在企业和组织内部,员工和团队通常需要访问特定额域的知识和信息,以解决问题、获得支持或做出决饿。传统的知识库和文档系统可能存在检系和更新的问题,导致信息不易获取。
在传统的知识获取中,用户将知识库放入到全文系引库中,然后用户利用关键词获取全文检索的结果,即属于当前传统搜索引擎的模式,该机式下主要存在以下两方面的问题:
全文检索的方式需要关键词精准命中,对用户的输入要求更高。
全文检素命中的是相关性,只是找到答案附近的文本,无法精准定位答案。
岩芯数智可控可信的通用大模型,提供一种更智本私域知识问答系统的背景是通过结合能、互动和高效的方式来访问和共事知识。
概述
京东作为一家新型实体企业,拥有着深厚的产业基因和供应链场实的业务求、深度复杂的场景任务和广泛的实体经济发展要求,使京东的A技术是面向知识密集型、任务型场景,解决真实产业问题的技术。且京东云旗下的言犀团队在任务型智能对话交互关键技术方向拥有丰富的积累和广泛的落地。拥有包括交本生成、语音生成对话生成等系列领先技术,并打造出了智能客服系统元、京小智平台商家服务系统,智能政务热线、言犀数字人等系列产品和解决方案
京东科技深耕人工智能领域多年,形成了从算法到应用场景的链路,并通过自研推出高犀基础大模型,赋予客户在各自行业中快选构建、部署,应用人工智能的能力。通过言犀基础大模型,企业可以建立从业务的大量数据中自我学习、自驱选代的能力,并实现对企业实施、运营、维护的一体化覆同时吉泽大模型中的小型化技术能够使企业具备云管边端协同运算力通讯资源受限场景的应对能力,和面对业务变化的快速响应能力。
需求分析
目前基础大模型正处于蓬勃发展阶段,各行业、各领域以构建数字化、线上化、搭建盛拟仿真场最为主要应用。在当前阶段下,基础大模型面临着以下问题:
一、由于基础技术的眼制以及大部分企业在大模型应用和硬件设备开发能力的不足从而导致无法自主生产原生 A 模型。
二、除了用户单点大模型开发技术能力的不足,在各行业链条中的软硬件互通、数据标准化和应用功能融合等问题中都存在着无法克服的壁垒。
三、大机型训练硬件的能源消耗问题,在当前全球绿色经济的背景下,平稳运行离不开大规模的数据中心和云计算中心等基础设施的支撑,而大部分企业则无法满足以上的要求,从而无法实现大模型的应用。
针对以上情况,开发言屋基础大模型,以实现低门槛构建基于人工智能技术的解决方案是本项目需要解决的问题。
京东推出的言屋基础大模型,将着力围绕内容生成、人机对话、用户意图理解、信息抽取、情感分类等几大类任务。围绕零售、物流、金融、健康、政务场景进行落地应用。
1)优质的场景和数据让模型产业属性更强
京东的言犀大模型,是扎根产业的原生大模型。凭借着从基础设施、型层、Maas 层Saas 层全栈的技术布局,打造多款到端的大机型技术产品,吉犀大模型拥有三个差异化的特性:
第一,它是产业原生的,有更强的产业属性。
第二,它是价值驱动的,有更高的应用价值。
第三,它是开放协同的,有更快的选代效率。
2)京东言犀大模型技术架构
京东言犀大模型是基于京东云的高性能计算集群,采用 Megatron+Deepspeed 的分布式训练框架,训练的 Decoder-Only架构机型。在通用知识获取方面,言犀大模型添加了约 30% 的京东域自身的产业数据,并通过构建高质量的指令效据,帮助模型具备更强的产业属性。除了模型训练本身,京东言犀大模型还在模型的转换层和服务层进行了自研算法的深耕。提升了大模型本身的推理速度和部署性能,让大模型的能力能够充分的下沉到业务端并通过集成平台能力打造真正的机型及服务。
3)前沿的算法能力保还模型具备高应用价值预训练层面
源于业务应用需求,京东在 2020年就提出了K-PLUG模型,将领域知识注入大模型中,以提高大机型的专业性和忠实度,并在 2021年对该项工作进行了发表。K-PLUG方法是基于Transformer 模型架构X京东的女业知识进行的预训练。
该算法帮助模型在实体属性抽取准确率为 96%;在生成式多轮对话 ROUGE-L(指标主要是对比机器生成的内容与人类的标准内容的匹配度)。以27% 领先于斯坦福经典的 Pointer-Generator;在上下文多轮问答知识检索率以 74% 准确率领先于行业。
4)澎湃算力打造开放协同的大模型生态
为了训练大模型,京东早在 2021 年就在重庆建成了大模型集群,也是全国首个基于 DGX SupErPOD 架构的超大规模计算集群-天琴ū,该集群在保障京东自身大模型训练的同时,还将集群的每秒浮点运算次数提升 40%,多卡线性加速比提开90%,为后续大模型的持续发展打下良好的基础。另一方面,为了更好的应对大模型背最下的海量数据存储问题,京东还自研了向量数据库 Vearch,支持百亿级向量监检素,召同实现毫秒级延迟,智能储存分层实现成本降低60%,大幅提升了型推理泛化能力与推理效率
报告共计:119页
海量/完整电子版/报告下载方式:公众号《人工智能学派》