通信世界网消息(CWW)2023年,AIGC和大模型产业井喷,凭借在语义理解、文本创作、代码编写、逻辑推理、知识问答等领域的卓越表现和低门槛交互方式,迅速获得大量用户,推动AI加速渗透进百行百业。随后各类AIGC应用涌现,给各行业智能化升级带来了新可能。国内市场方面,政府、运营商、高校、企业、科研机构等均开展大模型解决方案的研究、探索与实践,“AI+X”模式赋能产业变革、打造新质生产力的理念深入人心。
在国家政策层面,陆续出台了管理规定用以规范、监管AIGC的安全使用,众多地方政府也基于各地发展的不同需求出台相应的支持性政策,对AIGC大模型的落地起到积极指导作用。
当前运营商已成为为政府、企业提供综合信息服务的供应商,下面我们就来看在AIGC发展的大潮下,运营商如何结合自身的资源优势、技术优势,赋能政企业务创新。
AIGC政企场景化应用
AIGC在政务治理场景的应用
近年来,我国倡导发展人工智能,要加强人工智能同社会治理的结合,开发适用于政府服务和决策的人工智能系统,运用人工智能提高公共服务和社会治理水平。
有了党和政府的高度关注与支持,目前AIGC在政务场景中的应用(如图1所示)已较为成熟并规模化。首先通过基于实际政务数据对基座大模型进行微调,再通过外挂知识库保证政策、数据等信息的及时性和准确性,实现对政务领域知识和对话信息的学习理解。比如在咨询医保问题时,智能办事攻略能根据咨询者的身份归类,准确给出具体的办事流程、所需资料准备、办理时间和地点等,使咨询者免于从各种庞杂的规章政策中查询梳理对个人的少量有效信息,直接获取解决问题的答案。再比如事项申报中,申请者可以以自然语言或文档的形式提供申报内容,智能事项申报应用可以智能语义理解并处理形成结构化的数据,指示可能出现的错误信息并完成最终确认申报,极大提高事项处理的效率和准确率。其他的典型应用还包括“12345热线”智能分类处理、智能数据分析、智能公文编修等。这类AIGC智能治理应用以知识问答为主要交互形式,后端部署以政务大模型为核心的多种“数字公务员”智能角色,做到交互更友好,服务更贴心,决策更科学,处理更及时。
图1 AIGC在政务场景中的应用
AIGC技术在社会治理领域的应用有利于助推形成新的治理结构,凭借海量数据、人工智能及智慧应用打造出多种多样的平台或服务界面,以智能化、一体化的政务服务平台构建起新的治理结构,实现跨部门、跨领域的综合服务,推动治理和服务重心下移,提高行政能力与效率;有利于提高信息数据的分析效率,实现对语言、文字、图片、视频等形态的信息和数据获取的及时性和分析处理的准确性,可以作出更科学的决策;新的交互方式也有利于打破时空限制大幅提高决策与执行效率,为构建协同高效的政府数字化履职能力体系提供有力支撑。
AIGC在企业数据分析中的应用
在企业数据分析中,SQL取数是常见的操作,但是在实际操作中,可能会遇到一些挑战,如数据量大、查询语句复杂、性能问题等。随着大模型技术的越发成熟,可以掌握数据之间的潜在关联,处理复杂数据关系和流程(如图2所示)。通过ChatBI类的工具可以实现自然语言交互,使得非专业人员也能轻松地进行数据查询和分析,降低了数据分析的门槛,使更多人能够参与到数据分析工作中来。
图2 AIGC在企业数据分析中的应用
一是用户通过AI助手以文本或者语音输入所查询的问题。
二是AI助手将问题传给大模型使能平台进行任务拆解。基于识别的关键信息,并且结合倒排索引检索、向量库模糊搜索、RAG增强等先进技术,自动生成提示词。
三是大模型根据提示词生成SQL命令,并且结合插件库调用相关插件,对外可以输出SQL代码、图表、Word/Execl文档等多种可视化呈现方式。
ChatBI对于传统数据取数分析场景来说,带来了多方面的显著提升。
●效率与速度的提升:迅速响应查询需求,实现数据的快速提取和分析。
●交互方式的优化:自然语言交互的方式,使得非专业人员也能轻松地进行数据查询和分析,降低了数据分析的门槛。
●数据准确性与可靠性的提升:依靠先进的算法和大模型的能力,对数据进行自动清洗和整理,提高数据的准确性和可靠性。
●优化决策流程:为企业提供准确的数据洞察和趋势预测,使其更全面地了解市场状况、客户需求和业务运营情况,制定更科学合理的策略。
●降本增效:替换SQL取数技术人员,优化企业人力成本。
总的来说,ChatBI是一个强大的数据分析工具,它能够帮助企业更好地理解企业运营数据和信息,从而作出更明智的决策。
AIGC在K12普教个性化教学的应用
党的十九届五中全会明确提出建设高质量教育体系,“十四五”时期,必须在积极推进人工智能和教育深度融合过程中,加快人工智能教育社会实验研究,助力构建高质量教育体系。
当前人工智能已进入到教育的核心节点——教学领域的应用阶段。教育与技术的结合由来已久,互联网的兴起开启了在线教育时代。进入新世纪,随着人工智能的引入开启了自适应学习时代,特别是近期AIGC在教育领域的应用,个性化学习也从自适应学习向智适应学习升级。
学习的本质是持续的认知和经验积累的过程,而大模型恰好是知识沉淀的最佳载体,通过教育大模型针对海量学习资料、讲课视频、题库等建立多学科知识图谱。教师根据课程科目要求自动生成教案、作业、试卷等,并可结合多模态大模型的能力生成相关文字、声音、图像、视频等多态信息,用于直观、生动的教学活动中,还可以通过插件工具生成PPT、MP4等格式文件。基于学生的学情信息进行画像,根据学生的需求、特征、行为和反馈,动态地调整输出的策略、内容和形式,有效增强学习体验并提升学生的学习效率。大模型具有的多轮对话能力不仅能够将对话模式转变为苏格拉底式的启发提问方法,有助于学生的认知和理解,还能够根据学生的回答进一步提问,有效激发学生的思辨能力,可以说以大模型为基础的AIGC在教学方面的应用前景无比广阔。此外在教育中引入AR及数字人,乃至具身智能机器人技术,也将进一步提升AI辅助教育的交互性和趣味性。
AIGC在教学领域的应用能够帮助教师更专注于教学内容和教学探索,可以关注每个学生的情况,并“因材施教”为之定制教育内容,从而帮助学生更高效地学习。人工智能还能辅助教师管理课堂和学生,提供自动化的评分和反馈,进行及时高效的指导。总之,AIGC在K12教育中的应用为个性化学习、教学辅助和学习资源丰富化开启了全新模式,为提升教与学的效率、扩大优质教育资源覆盖面,进而实现教育公平性提供有效支撑。
AIGC行业应用落地离不开完善的工程化套件
AIGC行业应用落地确实面临着一系列困难,这些困难主要来源于技术实现、成本、数据质量等方面。如何才能实现高效落地?答案是离不开一套完整的工程化套件(如图3所示),通常包括数据处理、算法开发、模型训练、模型管理、模型推理、大模型应用使能等关键步骤,以此提供全方位的技术支持和服务。
图3 完整的工程化套件
新华三结合“绿洲数据平台+傲飞算力调度平台+大模型使能平台”,帮助客户一站式AI开发,实现快速高效AI应用落地。
一、通过绿洲平台(如图4所示)对大模型训练数据集进行数据相关处理,形成高质量的训练数据集。
图4 绿洲平台
绿洲平台提供全生命周期数据服务,提升数据质量。基于非结构化数据管理系统,建立数据清洗工作流,涵盖筛选、清洗、过滤全流程,提升数据集有效性、可靠性和隐私性,提高数据集质量。
二、通过傲飞算力调度平台,实现大模型从算法开发、模型训练/微调、模型管理到模型推理的一站式AI开发,通过“向导式+图形化”降低门槛。
算法开发
交互式开发:提供交互式建模环境,支持TensorFlow、Pytorch等计算框架,覆盖环境安装、代码编写调试等多个开发环节。
●便捷易用的用户体验:用户首页可通过模板一键生成并运行开发环境,支持一键克隆、保存开发环境。
●统一的资源和环境管控:统一镜像中心,预发布AI+GPU镜像;基于K8s架构统一管控CPU、GPU硬件资源。
●沉浸式编程体验:集成jupyter lab,支持多计算框架;支持与本地IDE无缝互通;“开发-调试-训练”高效衔接,提升工作效率。
●拖拽式建模(如图5所示):面向AI初学者提供拖拽式建模,内置70+算法组件,支持用户自定义脚本训练,且支持算法组件、作业类型可扩展。
图5 拖拽式建模
模型训练
●傲飞平台集成40+种主流开源大模型,包括LLaMA2、GLM、BLOOM、Baichuan等,支持推理和微调,通过封装简化大模型参数配置,提升易用性。
●内置微调脚本:客户在选择模型、调优方式(当前支持全量微调和lora微调)、超参配置和选择数据集后便可以进行一键训练。
●作业执行方式:支持单机单卡、单机多卡,以及多机多卡的作业执行方式。模型评估实现模型指标和能力的统一呈现,帮助用户基于业务场景能力需求进行模型选择,评估结果如图6所示。
图6 评估结果示意
●能力全面监控:汇总模型通用性能指标进行统一展示,方便用户监控模型迭代过程中的能力变化。
●模型评估全流程:从评估数据集创建、模型推理结果生成、输出内容格式转换到生成评估报告,实现评估业务全面管理。
●评估场景自定义:基于场景任务进行评估数据集选择、评估任务创建,最大程度保证评估任务和客户场景一致、评估结果和实际使用效果一致。模型推理引擎实现模型指标和能力的统一呈现,帮助用户基于业务场景能力需求进行模型选择。
●模型统一纳管:纳管新华三百业灵犀、其他商业大模型和开源大模型,支持用户模型上传平台统一管理。
●分布式推理:支持对模型的分布式推理部署,可灵活调整部署资源、推理引擎、超参配置等,应对多样的应用需求。
三、新华三大模型使能平台提供MaaS服务,降低AIGC应用落地门槛,利用知识库、插件、提示词功能和推理服务,赋能百行百业,结合大模型能力为垂直行业客户提供安全、定制、独享、生长的模型推理服务,大模型使能平台如图7所示。
图7 大模型使能平台
1.通过提示词服务提供四大主要业务场景提示词和14个细分场景提示词,帮助用户快速构建场景任务。
2.基于推理服务,通过屏蔽底层模型服务的差异进行多模型的统一管理。
3.通过多模型组合集成推理帮助用户实现个性化场景需求。
4.利用大模型时代的向量数据库为用户构建场景知识库,实现用户私域数据的快速接入。
5.结合使能平台对插件的定义标准,实现将三方业务系统以插件的形式进行接入,快速完成对现有业务系统的改造。
随着AIGC与智算技术的蓬勃发展,运营商将迎来智能化运营、创新业务驱动、to B业务应用深化及多元应用场景拓展等多重创新,不断优化服务质量,提升服务层级,乘着AIGC的大潮开拓政企业务新局面。