当前位置:首页|资讯|生成式AI|人工智能|AIGC

可信赖的企业级生成式AI白皮书(2024)

作者:AIGC资源社发布时间:2024-05-25

今天分享的是人工智能AIGC行业研究报告:《2024可信赖的企业级生成式AI白皮书》

精选报告来源:幻影视界

研究报告内容摘要如下

在企业端,人工智能产业的发展已驶入快车道,“让 AI成为核心生产力”已经成为企业领导的迫切需求。据中国信息通信研究院公布的数据,2023 年中国人工智能核心产业规模达到5784亿元,增速13.9%。根据麦肯锡研究报告,到2030年前,生成式Al有望为全球经济贡献约7万亿美元的价值,其中中国有望贡献其中约2万亿美元,将近全球总量的1/32。AI不仅可以推动整体经济和GDP的大幅增长,还将为那些善用AI的个人和组织带来前所未有的竞争优势。放眼全球,生成式AI对高科技行业将产生最为显著的影响;在中国,先进制造、电子与半导体、消费品、能源、银行将是受影响最为显著的5大行业。

生成式人工智能的应用前景

生成式人工智能的最终浪潮:世界模型的通用人工智能(AGI) ,全新的人机协同时代。随着人工智能被投喂的大数据变为一切与我们的生产、生活息息相关的世界万物时,它会成为基于世界模型的通用人工智能。这个人工智能将会带来理解、生成、逻辑、记忆能力的突破,会出现独当- -面的各类专业人才:数字艺术家、数字设计师、数字程序员、数字工程师、数字供应链专家等等。我们预计,到2030年,全能型、多模态的人工智能将进一步普及,人类的生产生活将进入全新的人机协同时代。生成人工智能有潜力彻底改变现有的经济和社会框架,就像电力和互联网-样。

企业级生成式人工智能参考架构

为更好的应对企业生成式人工智能所面临的挑战,我们从技术要素、治理要素和规划实施方法三维度进行企业级生成人工智能参考架构的讨论。

企业级生成式人工智能参考架构的治理要素

从企业的角度出发,对于生成式人工智能的治理应该融入业务周期的各个环节,同时贯穿从Al应用到基础设施各个技术层面。可解释性、透明性、公平性、健壮性、隐私性是企业级生成式AI治理的五大关键特征。第四章将讨论如何将治理与AI全生命周期相结合,介绍不同架构层级的相关技术手段和工具,通过引入对应的评估技术和一系列量化指标矩阵,从而确保在企业级生成式人工智能的可信可靠,帮助企业实现和维护高标准的治理水平。

人工智能平台和服务的总体功能架构图

人工智能平台和服务的总体功能架构图所示,人工智能平台的具体功能又可以分为训练框架及周边生态、训练加速框架、推理部署管理和模型与数据四个层次,实现了从模型训练到部署和应用的完整链条,为各种人工智能应用提供了全面的支持和服务。

  • 训练框架及周边生态:主要涉及各种人工智能模型的训练框架和相关的生态系统,包括各种开发工具、库和框架,以及数据处理、模型评估等辅助工具。
  • 训练加速框架:主要关注如何提高模型训练的速度和效率,涉及分布式训练框架,以及各种加速算法和优化技术,旨在提高平台的整体性能。
  • 推理部署管理:主要涉及模型的部署、管理和运行,推理引擎的选择和配置,以及运行时的监控和管理等工作。
  • 模型与数据:这一层可分为知识工程和基础模型两大部分。知识工程介绍构建、管理.和利用知识库或知识图谱的技术,旨在支撑和增强基础模型功能。基础模型部分围绕将模型应用于企业实际业务场景中的关键步骤和技术挑战,从模型的评估与选择,数据准备,微调与训练、合作、优化以及典型上层应用等方面进行展开。

企业专用模型问答系统工程化落地

通用大模型对于专用领域的回答准确率通常低,需要构造企业专用大模型来满足准确率的要求。企业专用模型工程化落地主要包含下面几个阶段(详见下图15大模型解决方案) :

选取合适的模型。通用大模型使用了公开的数据集,通用知识,针对专有领域的准确度低,而且通用大模型预训练要花费大量的算力成本,对于企业而言,需要整合考量模型规模和资源消耗,选择合适的模型而不是- -味追求规模大的模型。

训练专用模型。通常要构建企业的专有模型,企业需要提供高质量的内部数据集,对模型进行训练。这个阶段需要关注数据的质量,数据的治理,建立专有的企业知识库,对专有模型进行微调,知识扩充(可以外接知识库来做增强)。

专用大模型反馈阶段。通过给大模型问答提示与引导应用模型,对模型给出的回答进行打分,排序,进一步优化模型,不断更新知识库,随着知识的累积,继续优化模型。

专用大模型的部署。在整个过程需要一 个整体平台覆盖模型训练,服务服务应用,模型部署等,需要对模型的生命周期进行管理,并且要求平台稳定,安全,可扩展。

生成式人工智能治理框架

本框架的核心在于打造可信赖的Al系统,面向AI全生命周期的全时段,贯穿技术栈的全方位治理,围绕着五个关键特征,即可解释性、公平性、透明性、健壮性和隐私性展开。

  • 可解释性: AI系统模型做出决策或预测的依据,这些解释应该可供具有专业知识和能力的人和公众所理解。在技术上可以通过知识工程,AIX360, 数据地图,数据标准,元数据管理等方式提高模型和数据的可解释性。
  • 透明性: AI系统的相关数据(包括原始数据和使用过程中产生的元数据)应作为信息披露的内容,如出现在产品说明中或供审计使用。在技术上可以通过知识工程,模型生命周期,模型可视化,数据生命周期,数据地图,平台的可观测性等实现AI系统的透明性。
  • 公平性: AI系统应确保决策过程和结果不歧视任何个人或群体,其表现应与统计学规律以及业务内容相吻合,对所有用户均公平公正。例如,贷款审批模型对信用不良的人产生的“偏见”是合理的。在技术上可以通过偏见预防与检测,数据质量管控等来提高AI系统的公平性。
  • 健壮性: AI系统应对外界变化和潜在的攻击有抵抗力,能够稳定地运行,有效处理异常情况和蓄意的对抗攻击,降低安全风险。在技术上可以通过对抗攻击的检测与预防,数据质量管控,平台级的能源规划等来保障AI系统的健壮性。
  • 隐私性:系统必须保护个人隐私,确保用户数据的收集、处理和存储安全,且遵循相关的隐私保护法律法规。在技术上可以通过联邦学习,多方安全计算,匿名化,差异隐私,数据脱敏,数据安全等技术来保障AI系统的隐私性。

基于这五个特征,本章节将会讨论如何将治理与AI全生命周期相结合,介绍在不同技术层面的相关技术手段和工具,通过引入对应的评估技术和一系列量化指标矩阵,从而确保在企业引入生成式人工智能的全生命周期内满足这些标准,帮助企业实现和维护高标准的治理水平。

生成式人工智能数据治理

数据治理主要包括主数据管理,元数据管理,数据质量,数据标准,数据安全与隐私保护,数据地图和数据生命周期等核心功能。数据治理在数据全生命周期中发挥着重要的作用,经过治理后的数据提供给消费者,才能最大化数据产生价值。详见图21数据治理功能图。

报告原文节选如下:

本文仅供参考,不代表我们的任何投资建议。【幻影视界】整理分享的资料仅推荐阅读,用户获取的资料仅供个人学习,如需使用请参阅报告原文。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1