年初AI大模型呈现井喷式的增长,3月OpenAI率先发布GPT-4,具备零样本学习能力和更深层的语义理解能力,除文字内容交互外,还新增数据分析、逻辑推理能力,其搭载多模态模型能够处理多媒体数据,可将内容有效整合到统一语义空间中,相关数据显示GPT-4参数量级已达1万亿级别。
GPT-4让国内许多企业看到AI大模型的商业前景,百度紧跟GPT-4率先发布文心一言,而后包括阿里通义千问、华为盘古、腾讯混元、360智脑、讯飞星火纷纷跟进。截止2023年6月,国内头部参与研发AI通用大语言模型的企业已超30家。而在垂直细分赛道市场,参与AI大语言模型的企业更是超过百余家,一时间国内AI大模型呈现百家争鸣态势。
▍AI大模型注入具身机器人赛道 加速传统领域智能化转型
2023年上半年有两个重要事件值得高度关注,5月16日特斯拉股东大会上,Elon Musk展示了Optimus人形机器人最新进展,这一次,Optimus已经拥有电机扭矩控制、环境探索与记忆、基于人类跟踪运动的AI训练以及物体操纵能力。
与2022年AI Day Optimus人形机器人首秀相比,新版本的Optimus自动化程度更高。但与此同时,马斯克也强调,目前Optimus现在还没有任何深刻的思维能力,只能完成基本的任务,可以看到目前制约人形机器人的短板已经从硬件研发层面上升到AI大模型。如何让人形机器人变得更智能,更能与我们产生深度交互,才是智能机器人的后半场需要考虑的问题。
同样5月在比利时举办的ITF2023年半导体大会上,黄仁勋向在场观众介绍了多模态人工智能技术NVIDIA VIMA,VIMA能根据视觉、文本提示执行任务。
黄仁勋认为下一波人工智能浪潮是“具身人工智能”,即能够理解、推理并与物理世界互动的智能系统,不同于传统机器人仅具有“物理”执行力。AI大模型可通过将图像、文字、具身数据联合训练,引入多模态输入,进而提升大模型和环境的交互能力和学习能力,为机器人注入“灵魂”。
具身机器人作为“具身人工智能”的载体,除了能够实现在现实世界中的交互之外,还可以像人类一样具备视觉、听觉、触觉等,以感知周围环境的能力。据悉,具身智能机器人可提供更多智能化应用场景,如医疗护理、灾害救援、制造业以及客户服务市场等。赋能传统领域,加速产业的智能化与数字化转型。
▍国产具身智能机器人“小瑞”亮相 搭载国产AI大语言模型
在具身智能机器人赛道,国内企业纷纷率先探索。近日,东港股份有限公司下属子公司东港瑞宏就已联合中关村RFC机器人联盟头部企业上海归墟电子、北京康力优蓝机器人、深圳锐曼机器人联合打造首款政务系统专用智能机器人-“小瑞”正式亮相,并已应用于政务大厅场景,助力政务信息智能化升级,为政府机构和公众提供更加高效、精准的服务。
早在2022年东港股份就组建人工智能技术研发团队,重点研究人工智能技术自动生成内容(AIGC)和自然语言处理(NLP)技术。目前东港股份已为政务系统打造专属域AI大模型,实现大语言模型国产化。该模型基于隐空间的生成式开放域以及强大的知识图谱积累,采用多任务训练方案,且拥有强大的自然语言处理和学习能力。
有别于传统通用型AI大模型,东港政务专属域AI大模型聚焦细分赛道,采用特定领域训练数据,针对性更强。并且能够提供更加快速,精准,高效的内容交互方式。目前东港股份已全面实现国产化大语言模型在政务智能机器人领域应用。
本次亮相的“小瑞”具身机器人拥有多模态输入功能,系统可感知到的图像、文字以及具身数据进行联合训练,能够同时处理和理解视觉和语言信息,在视觉信息和语言信息互相关联的场景下,能够更好地理解上下文交互内容,从而拥有更自然的人机交互方式与更好的内容理解能力。
此外“小瑞”在图像、视觉、视频以及深度学习方面效果显著,这得益于高性能边缘化计算芯片,能够同时实时处理数十种算法,用于传感器处理、测距、定位绘图、视觉感知以及路径规划,让机器人能够从传感器获取输入、定位自身、感知环境、识别并预测附近物体的运动,提前规划出合理动作并安全执行。
▍依托专属域AI大模型 “小瑞”机器人聚焦电子政务场景落地应用
目前“小瑞”机器人搭载的专属域AI大模型已具备在电子政务场景下的应用能力,同时具备四大场景服务优势:
优势一:减少政务服务人力成本 提供全流程引导仿人模拟服务
传统政务部门采用人工引导方式,对前来办理业务的人员进行指引。但取决于工作人员的业务技能与熟悉程度,不同业务所携带材料不同,办理路径不同,有时候很难做到100%精确指引。
“小瑞”机器人可通过学习政府机构的信息和服务流程,为前来办理业务的人员提供有关政府机构的信息查询和服务申请,如指引服务、业务办理选择和区号服务,在迎宾模式下可实现智能接待与讲解工作,同时协同办理业务人员从大厅到柜台再到离厅的陪伴式引导服务。标准化的信息查询与业务咨询服务,能够有效减少业务人员的等待时间,加快业务办理的进度,同时减少人力成本。
优势二:基于多模态交互信息的搜集与分析 政务咨询与检索更有针对性
与传统机器人固定式回答不同,“小瑞”机器人依托于多模态交互信息的搜集与分析能力,具备更深层的语音语义理解能力,可为公众提供更加个性化的指导与服务。当用户需要在政府网站或社交媒体留言时,“小瑞”可以通过智能大脑的情感分析和自然语言生成技术,快速捕捉公众需求,给出针对性地服务于建议,让政务咨询变得更加高效。
优势三:具备海量数据分析能力 支持快速响应决策支持与建议
除收集公众意见与反馈之外,“小瑞”还拥有强大的数据分析与整理能力,如政府部门针对某一政策想要调取公众对政策的意见与评价。“小瑞”即可通过语言模型的文本挖掘和机器学习技术,快速准确地分析公众的言论和情感,并向政府机构提供相关的分析报告和建议。减少人为统计与归纳整理时间,大幅提升工作效率。
优势四:可实现自主移动与环境交互 提供智能化巡视服务
作为具身机器人家族的一员,“小瑞”搭载3D人体动作捕捉系统,能够像真人一样在大厅中行走于公众互动,并可实现全自主状态下的导航与视觉识别技术,提供实时巡视与监测服务。在实际应用场景下,如遇公众在某窗口排队等候,“小瑞”可通过视觉识别技术,快速准确地判断窗口的排队情况,并提醒工作人员及时处理,加快业务办理过程。
▍结语与未来:
根据尚普咨询的相关数据显示,2022年中国电子政务市场规模已达4100亿元,其中硬件占比最高达到32%,其余为网络设备14%,软件占比24%,服务占比30%。而2023年预估市场规模将超4500亿。在数字化转型和智慧城市背景下,电子政务市场拥有巨大的发展空间和成长潜力。
而以国产AI大模型为载体的具身机器人“小瑞”快速切入政务系统细分赛道,减轻政务系统人力成本,提升数据整理与分析能力,改善公众服务体验,同时为公众提供精准化与智能化的政务引导服务,助力政务系统的智慧化、数字化转型。未来“小瑞”也将切入不同赛道,如医院、银行、机场、博物馆等数百个细分垂直场景,推动传统行业的转型升级,实现AI的商业价值的深度挖掘,赋能千业百态。