今天分享的是储能系列深度研究报告:《 中国人工智能技术应用成熟度白皮书 》。(报告出品方:中国人工智能产业发展联盟 (AIIA) )
第一章人工智能概述
1.1 人工智能定义
人工智能并非诞生于现代。事实上,它的起源可以追溯到古希腊时期甚至更早,始于人类膜拜神灵的古老愿望。在希腊神话中,赫菲斯托斯是赫拉和宙斯的儿子,他出生时身体虚弱,在被抛到了奥林匹斯山上后,被爱琴海岛屿利姆诺斯岛人所救,长大后的赫菲斯托斯制造了一个魔法宝座。该宝座具有现代人工智能的特征:为助人们实现某个目标,能够根据情况提前编程并以不同方式作出响应。
亚里士多德(公元前 384 年-322 年)是精确制定规则的第一人,他开发的非正式三段论,在原则上允许人们能够在给定的初始前提下机械地得出结论。现代人工智能的种子是最初由古典哲学家种下,他们试图将人类思维过程描述为机械符号并操纵。这种思想一定程度促进了 20 世纪 40 年代可编程数字计算机的发明,并激发了后续讨论建立电子大脑的可能性。经过多年的发展,人工智能已经发展成为一门覆盖领域十分广泛且极富挑战性的技术科学,也正因如此,人工智能的定义到现在依旧是百家争鸣,但其核心思想却始终如一——像人类一样思考的机器。
人工智能最早是由麻省理工学院的 John McCarthy 在1956 年达特茅斯会议上提出的,McCarthy 将其定义为:人工智能就是让机器的行为看起来像是人所表现出的智能行为一样(McCarthy 1956)。图灵奖得主Edward Feigenbaum把人工智能定义为:人工智能属于计算机科学的一个分支,旨在设计智能的计算机系统,即对照人类在自然语言理解、学习、推理、问题求解等方面的智能行为,人工智能所设计的系统应呈现出与人类行为类似的特征(Feigenbaumetal.1981)。玛格丽特·博登在《人工智能哲学》一书中就目前四种最为流行的人工智能定义进行了归类和辨析,分别为:(1)人工智能就是让计算机去做人类需要运用智能才能做的事;(2)研究怎样制造计算机,并为其编程,使其能做心灵所能做的那些事情;(3)人工智能是计算机的发展,而计算机的外在性能具有我们认为是属于人类心理过程的那些特征;(4)人工智能是一种一般性的智能科学,是认知科学的智力内核,它的目标是提供一个系统的理论,既可解释意向性,也可以解释以此为基础的各种心理能力。其中,玛格丽特认为前三种定义各自有其偏颇和缺陷,只是对技术的表层功能进行了阐释,没有上升到理论和哲学的高度,而第四种定义则能够从心理认知的角度进行阐释。完整版报告下载:关注公众号【百家全行业报告】
我国学者在人工智能的定义上也是各引一端。中国科学院院士、清华大学人工智能研究院院长张钹认为人工智能是利用机器去模仿人的智能行为,这些智能行为包括推理、决策、规划、感知和运动。中国科学院院士、中国科学院自动化所研究员谭铁牛认为人工智能是一门以探寻智能本质、研制具有类人智能的智能机器为目的,以模拟、延伸和扩展人类智能的理论、方法、技术及应用系统为内容,以会看、会说、会行动、会思考、会学习为表现形式的学科(谭铁牛,2018)。中国通信学会将人工智能定义为:研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,将其视为计算机科学的一个分支,指出其研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等(张 et al.2018)。《人工智能标准化白皮书 2018》中认为人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统(Cesi,2018)。
目前,为人工智能进行普适性定义比较困难,且从时间的维度来看,人工智能的内涵仍在不断丰富和发展,涵盖的领域也越来越多。正如前美国麻省理工学院人工智能实验室主任 Patrick Winston 所述,当前给出一个一般性的人工智能定义似乎是不可能的,因为智能似乎是一个包含着许多信息处理和信息表达技能的混合体(Winston and Shellard,1990)。目前,学界的共识多为“让计算机为人类做各种各样的事情”且“人工智能是建立在现代算法基础上,以历史数据为支撑而形成的具有感知、推理、学习、决策等思维活动并能够按照一定目标完成相应行为的计算机系统”。
近期,以 ChatGPT 为典型的通用人工智能(AGI)引起了广泛关注。通用人工智能一直是人工智能研究领域备受关注和争论的话题,尤其是自GPT-4推出以来。AGI 代表着在软件中模拟人类认知能力,使系统能够找到解决不熟悉任务的方法。其最终目标是能够执行人类可以完成的任何任务,特别是在自然语言理解方面。然而,目前并没有一个全球公认的通用人工智能的定义。通用人工智能的例子有很多,比如自动驾驶汽车、无人机机器人,甚至像ChatGPT-4这样的聊天机器人。
1.2 人工智能分类
1.2.1 行业分类
人工智能已经渗透进我们生活的角角落落。近年来,人工智能已经被提升到国家战略高度,在“新基建”背景下,人工智能为智能经济的发展和产业数字化转型提供底层支撑,推动人工智能与 5G、云计算、大数据、物联网等领域深度融合,由此衍生出更多的应用场景,加速人工智能与数字经济融合的进程。
综合人工智能与各行业融合应用情况,我们将人工智能行业划分为服务机器人、自动驾驶、基础软硬件、智能座舱、云计算、电商及零售、智慧医疗、智能客服、智慧网络、智能家居、智慧建筑、智慧出行、智慧金融、智慧教育十四个一级行业分支,以及每个行业分支衍生的二级行业分支,如图1 示出。
该分支简图是基于《中国人工智能产业知识产权白皮书(2021)》报告中的行业分类图来进行修改的。相较《中国人工智能产业知识产权白皮书(2021)》,本白皮书报告中,人工智能行业分类删除了智能媒体、智慧农业、智慧城建、智能防疫应用等,新增了服务机器人、基础软硬件、云计算这几个全新的领域;将智能座舱、智慧出行和自动驾驶进行了分离界定,分别覆盖不同的领域。
智能服务机器人
智能服务机器人是在非结构环境下为人类提供必要服务的多种高技术集成的智能化装备。近年来,随着人工智能、5G、云计算、物联网、大数据的快速发展,以及场景需求的不断拓展,在包括计算机视觉及语音交互、伺服驱动器、定位导航、运动规划及控制等技术的加持赋能下,具有感知、分析及处理来自外部环境的信息等智慧能力的成为智能服务机器人的标配。
从应用场景和产业发展进行划分,本报告将智能服务机器人产业可以分为面向家庭的消费类服务机器人产业以及面向公共商用环境的商用服务机器人产业两大类,其中又细分为综合家庭助理机器人、家务服务机器人、养老康护机器人、教育娱乐机器人、讲解接待机器人、餐饮酒店机器人、云平台机器人等智能服务机器人子产业。其中,以智能清洁机器人品类为代表的家务服务机器人产业,已经取得了爆发式的发展。
中国智能机器人产业起步较晚,但受益于我国产业政策大力支持和引导发展迅速。政府相关部门已颁布一系列利好政策推动智能机器人产业的发展,中国服务机器人的销售额增速持续高于全球服务机器人销售额增速,保持良好增长态势。
基础软硬件
基础软硬件,通常是指 AI 基础软硬件,是人工智能算法与硬件平台相结合,实现更高效的计算和更快的响应速度的软硬件系统,它包括AI 芯片(如NPU、GPU 等)、芯片使能(如昇腾 CANN、英伟达 CUDA 等)、AI 计算框架(如Pytorch、MindSpore 等)、开发使能及工具等。
AI 芯片是专门用于处理人工智能应用中大量计算任务的模块,主要有NPU、GPU 等类型。GPU 是通用芯片,经过软硬件优化可以高效支持AI 应用。NPU是专门为 AI 产品或服务而设计的芯片,主要是侧重加速机器学习(尤其是神经网络、深度学习),这也是目前 AI 芯片中最多的形式。目前全球AI 芯片市场上,华为、英伟达、英特尔、AMD 等公司都在研发和生产AI 芯片,其中,华为的昇腾系列芯片已经成为全球领先的 AI 芯片之一。
AI 框架是一种软件框架,用于构建、训练和部署人工智能模型。AI 框架提供了一组 API,使开发人员能够构建和训练自己的模型。这些API 通常包括用于定义模型的函数、用于训练模型的函数以及用于评估模型的函数。AI 框架还提供了一些工具,如可视化工具和调试器,以帮助开发人员更轻松地构建和调试模型。目前主流的 AI 框架有 PyTorch、MindSpore、PaddlePaddle 等,MindSpore是华为开源自研的 AI 框架,支持端边云全场景的深度学习框架,在大模型、AI4S等新方向具备独特优势。
总之,AI 软硬件平台是一个集成了各种人工智能开发所需的软硬件资源的系统,可以帮助开发人员更加高效地进行人工智能应用的开发和部署,是人工智能产业的根基。
云计算
云计算产业是基于云计算技术的一种新型计算模式,它将计算资源、软件工具和数据存储服务等提供给用户,使用户可以通过互联网访问和使用这些资源和服务。云计算产业通过在云端部署和管理计算资源,提供了一种灵活、可扩展和高效的计算模式,为、政府机构和个人用户提供了更加便捷、可靠和经济的计算解决方案。
云计算产业包括了各种类型的云计算服务和解决方案,例如基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)等,近些年又因为AI 技术的蓬勃发展,提出了模型即服务(MaaS)等形式。云计算产业的主要参与者包括了云计算服务提供商、软件开发商、数据中心运营商、网络技术公司、安全服务提供商等,它们通过不断创新和扩展服务范围,推动着云计算产业的快速发展和普及。
智能座舱
智慧座舱最初运用于飞机上,包括高分辨率显示屏、先进的飞行控制系统、自动化系统、数据链接和人机界面等。智慧座舱旨在提高飞行员的工作效率和安全性,同时减少人为错误和疲劳。
近年来,汽车不断向智能化发展。智能座舱、智能驾驶作为汽车智能时代双子星。智慧座舱包括了带给驾驶员和乘客更加安全、舒适、智能的驾乘体验所有模块,包括操控系统、娱乐系统、空调系统、通信系统、座椅系统、交互系统、感知系统等。
从车内看,智能座舱是座舱内饰、座舱电子产品的综合创新、升级和联动。智能座舱内饰包括座椅、灯光、空调等,用户可以对座舱内各内饰功能进行控制,伴随语音语义识别、机器视觉等技术的发展,座舱内饰的智能化程度逐渐提升。智能座舱电子产品包括全液晶仪表、车载信息娱乐系统、车联网模块、抬头显示(HID)、流媒体后视镜等汽车电子设备。同时也将与智能手机、手表等实现互联,进而与智慧家庭、智慧办公等场景无缝衔接,助力互联的全面打通,最终实现将汽车由单一的驾驶、乘坐工具升级为一个以消费者为中心的“智能移动空间”。
从车外看,智能座舱将通过车联网、无线通信、远程感应、GPS等技术,与车外的各项基础网联设施、联网设备实现 V2X(Vehicle-to-Everything)联结。感知交通信号、路况、车外娱乐生活场景信号,助力自动驾驶感知层和决策层的工作,进而推动高阶自动驾驶的实现。除此之外,为了提高座舱AI 算力,模拟人的思考、更懂人、感知人,从而主动精确地提供服务,座舱内部的决策运算工作也将扩展至车外,在车载芯片外建立独立感知层,由云端计算中心统一提供AI 算力。
智慧出行
智慧出行以互联网预约车辆出行为背景,包含智能订单调度,车辆自动驾驶,智能语音交互,实时交通情况预测,出行路径规划等功能需求,以“AI+智慧交通服务”,在传统的出行行业基础上,以人工智能相关技术为助力,改善出行效率及安全性,提高司乘体验,增进产业更新换代,高效保障出行质量
自动驾驶
自动驾驶汽车(Autonomous vehicles;Self-driving automobile)又称无人驾驶汽车、电脑驾驶汽车、或轮式移动机器人,是一种通过电脑系统实现无人驾驶的智能汽车。自动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让电脑可以在没有任何人类主动的操作下,自动安全地操作机动车辆。
1.2.2 技术分类
人工智能涉及范围广泛,以技术来分类,目前主要分为(此处参考21、20年的白皮书内容)通用机器学习、AI 感知、AI 认知、AI 系统四大核心技术分类。
通用机器学习
通用机器学习是一种机器学习方法,它可以应用于各种不同的任务和领域,而不需要进行大量的领域特定的调整或修改。通用机器学习算法可以从数据中学习模式和规律,并使用这些模式和规律来进行预测、分类、聚类等任务。通用机器学习算法的例子包括决策树、支持向量机、神经网络等。
AI 感知
AI 感知技术是指将物理世界的信号通过摄像头、麦克风或者其他传感器的硬件设备,借助语音识别、图像识别等前沿技术,映射到数字世界,再将这些数字信息进一步提升至可认知的层次。AI 感知技术可以帮助人工智能系统理解和感知周围环境,从而更好地进行决策和行动。例如,计算机视觉技术可以帮助人工智能系统识别图像和视频中的对象和场景,语音识别技术可以帮助人工智能系统理解和转换语音命令,自然语言处理技术可以帮助人工智能系统理解和生成自然语言文本。AI 感知技术是实现人工智能智能化的重要组成部分。
AI 认知
AI 认知是指人工智能系统通过模拟人类的认知过程,实现对信息的理解、推理、学习和决策等高级智能功能。AI 认知技术包括自然语言处理、知识表示与推理、机器学习、深度学习、推荐系统等。通过这些技术,人工智能系统可以从大量的数据中学习和发现规律,从而实现对复杂问题的理解和解决。AI 认知技术的应用包括智能客服、智能翻译、智能推荐、智能问答等。
当前通用人工智能(AGI)高速发展,出现了大模型这一类通用人工智能基础设施建设的热潮,其在认知层的记忆、理解、规划、决策等能力涌现,应用于各种领域,如自然语言处理、计算机视觉、智能交通等。
AI 系统
AI 系统是指一种基于人工智能技术的计算机系统,它可以模拟人类的智能行为和思维过程,实现自主决策、自主学习和自主适应等高级智能功能。
AI 系统可以通过感知、认知、推理和决策等环节,对外部环境进行感知和理解,并根据自身的目标和任务,自主地进行决策和行动。AI 系统的应用非常广泛,包括智能客服、智能翻译、智能推荐、智能问答、自动驾驶、智能制造等领域。随着人工智能技术的不断发展和应用,AI 系统将会在更多的领域发挥重要作用。
本章小结
本章节介绍了人工智能在现代社会中的重要性和应用领域。
目前学界普遍认为,人工智能的目标是让计算机能够为人类完成各种任务。人工智能是建立在现代算法基础上的一种技术,通过历史数据支持,具有感知、推理、学习、决策等思维活动。
近年来,人工智能已成为国家战略的重要组成部分,在新基建背景下,为智能经济的发展和产业数字化转型提供了底层支撑。人工智能与5G、云计算、大数据、物联网等领域深度融合,衍生出更多的应用场景。我们将人工智能行业划分为智能制造、智慧教育、智慧金融以及智能家居、智慧物流、智慧交通、智慧医疗等十六个一级行业分支,并介绍了每个行业分支的二级衍生分支。此外,我们还将以技术进行关键点分类,包括通用机器学习、AI 感知、AI 认知、AI 系统。按照这样的分类,我们会在各个章节的框架中进行应用。
2.1 综合产业应用分析
人工智能的综合产业应用分析是指对人工智能在各个行业和领域中的广泛应用进行全面评估和分析的过程。它涉及对人工智能技术在不同行业中的应用情况、技术成熟度、发展趋势等方面进行综合考察和研究。
在人工智能的综合产业应用分析中,研究人员会通过收集和整理相关行业中人工智能应用的对应技术点知识产权情况和学术论文,分析其人工智能技术的发展趋势、创新方向等,通过人工智能的综合产业应用分析,可以帮助和决策者更好地了解人工智能在不同行业中的应用潜力,为相关行业的发展提供指导和决策支持。此外,该分析也有助于推动人工智能技术的创新和进步,促进人工智能产业的健康发展。
2.1.1 主要 AI 技术大类及综合产业应用
人工智能技术已经在各个领域产生了深远的影响。在产业界,AI 技术的应用已经成为一种趋势,它正在改变着我们的生产方式、商业模式和市场格局。综合人工智能技术与各产业融合应用情况,下图示出了 AI 技术在产业应用的简图。
2.1.2 技术成熟度分析方法
技术成熟度分析方法是评估一项技术在产业化上成熟度或发展阶段的方法。
数据源:分析的数据来源一方面是通过面向各细分行业征集核心技术点,通过知识产权搜索工具和核心期刊、论文查询工具得到对应的统计数据集;另一方面是通过面向各细分行业专家、学者进行问卷调研,进行主观判断相对应技术点所处于的阶段,该阶段参考了 Gartner 技术成熟度曲线将技术的发展分成了五个阶段(萌芽期、膨胀期、破灭期、爬升期、成熟期),并对应进行打分(1-5分),形成对应数据集。
分析工具:本文引入了两种分析工具:四象限分析、热度-供给图与阶段-供给图,以下具体介绍。
2.1.2.1 学术界与产业界成果四象限图
四象限图是一种常用的工具,本文中我们将学术界和产业界相关产出进行分类和可视化,表示为横坐标和纵坐标,形成了一个由四个象限图,它们分别代表:
产业关注:这个象限位于第一象限,是相对应的技术点备受产业界关注,相关产业方向的知识产权产出比较多,而学术论文较少;
大众关注:这个象限位于第二象限,是相对应的技术点备受产业界和学术界关注,相关产业方向的知识产权产出和学术论文均较多;
小众关注:这个象限位于第三象限,是相对应的技术点在产业界和学术界相关产出均较少,相关学术论文和产业方向的知识产权均较少;
学术关注:这个象限位于第四象限,是相对应的技术点备受学术界关注,相关学术论文产出较多,而产业方向的知识产权较少。
该图意在对比不同技术点在学术界与产业界的研究情况与热度。我们通过近十年知识产权的数量来反应相关技术点在产业界的研发热度,通过近三年论文的数量来反应相关技术点在学术界的研究热度,以论文数量作为横坐标、知识产权数量作为纵坐标绘制成学术界与产业界成果四象限图(以下简称四象限图)。对于每个产业方向,我们分别以论文数和知识产权数的对数平均值作为不同象限的分界线。
通过四象限图,我们可以大致看出在该产业方向中,学术界与产业界对不同技术点的关注情况。具体来说,位于四象限图中第一象限的技术点受到了学术界和产业界的一致关注,这一定程度上可以反映出该技术点正处在蓬勃发展的过程中,在前沿技术和落地应用上均有很大的提升和研究空间,同时也反映出该技术点在实际的应用场景中具有较高的价值。而位于第二象限中的技术点则更多的受到了产业界的关注,在学术界中对于它们的研究相对较少,这可能是因为相关技术在学术研究的角度上已经相对成熟,相对更需要的是与实际场景结合的适配工作,也可能是相关问题刚刚从实际的应用场景中被抽象和归纳出来,暂时没有进入学术界的视野中;相反,在第四象限中的技术点则更多被学术界关注,这可能是学术界的研究相对超前暂时不能被应用到实际生产生活中导致的。具体导致二四象限中的点呈现出这种学术界和产业界的关注度和热度不相匹配的原因可能是多种多样的,前文仅仅列举出了部分常见的原因,在之后对具体的产业方向的四象限图进行分析的过程中会进行更加有针对性的分析。最后,位于第三象限的技术点的热度在两个界别中均相对较低,导致这种情况发生的原因也有许多可能,例如:相关技术点趋于成熟,剩余未解决的问题都相对困难和棘手;技术点处在萌芽阶段,还未被广泛关注等。
2.1.2.2 热度-供给图与阶段-供给图
数据定义:为了更加准确的反映各个技术点的研究热度以及产学供给情况等,我们设计了调查问卷,邀请学术界的研究专家和产业界的产业专家对技术点所处阶段、产业界和学术界的热度、产学供给情况进行主观打分。考虑到数据离群的干扰,会对于参与调研的专家提出要求,并结合行业情况进行评分,截止撰稿时,共收集到数百份有效调研材料。
技术点所处阶段:技术点所处的阶段是参考 Gartner 技术成熟度曲线将技术的发展分成了五个阶段,萌芽期、膨胀期、破灭期、爬升期、成熟期。
产业界和学术界的热度:热度大致被分为了五个等级,其中3 代表了技术点所属的产业方向的平均热度、1 代表热度最低、5 代表热度最高。
产学供给情况:产学供给情况也被大致分为了五个等级,其中3 代表了技术点所属产业方向供给的平均水平、1 代表供给最少、5 代表供给最多。
在具体绘图前,考虑到数据的代表性问题,我们筛选掉了收集到的问卷少于10 个的技术点。对于剩余的技术点,根据相应问卷得到的评价的平均和方差情况,绘制了热度-供给图与阶段-供给图。在图中,椭圆的中心位置代表了相应指标的平均水平,而椭圆的两轴的长度代表了相应指标的方差情况。
第三章智慧金融
3.1 产业定义
近年来,信息科技的发展取得了长足进步,云计算、大数据、移动互联网、区块链、物联网以及以深度学习、数据挖掘、机器学习等为首的人工智能技术日益成熟,相关技术的广泛应用使人类社会从电子化、信息化、网络化、数字化正式逐步迈向智能化时代。同时,现代金融消费者对于金融产品与服务的时效性、便捷性、个性化、智能化、定制化等方面的需求逐渐提高,加快了金融产品创新加速。随着信息技术与金融的深入融合,智慧金融应运而生。
智慧金融依托于互联网技术,运用大数据、人工智能、云计算等科技手段,打造金融产品和服务模式,使金融行业的业务流程、客户服务方面得到全面的提升,实现金融服务、营销、运营、风控的智慧化。智慧金融的参与者不仅包括为金融机构提供人工智能技术服务的,也包括传统金融机构、监管机构等,这些参与者共同构建了智慧金融生态圈。
国务院于 2017 年 7 月印发的《新一代人工智能发展规划》中首次正式提出要发展“智能金融”,要求“创新智能金融产品和服务,发展金融新业态”;工业和信息化部于 2017 年 12 月印发的《促进新一代人工智能产业发展三年行动计划(2018-2020 年)》中也提出要积极培育人工智能创新产品和服务,促进人工智能技术的产业化,推动智能产品在金融领域的集成应用。在众多产业政策接连出台的背景下,智能金融的蓬勃发展带来了产品与服务不断突破创新,以最新科技支撑的智能金融使得金融体系和商业模式的运行发生了重大的变革。智慧金融将成为未来金融产业创新和转型的重要发展趋势,也是提升金融业整体效率的必经之路。
3.3 主要技术在产业的应用
3.3.1 智能营销
利用人工智能,结合线上和线下消费渠道数据,采用多模型的方式,实现用户精准的画像系统及实时的消费倾向分析,给予最匹配的消费推荐;以大数据、人工智能技术为基础,及时、准确识别用户需求,提供个性化的营销方式有效触达人群,实现人货场的最佳匹配,提升营销效率,降低营销成本。
3.3.2 智能服务
利用语音识别、语音生成、自然语言处理、大数据及深度学习等技术,基于用户历史信息智能挖掘用户需求,为用户主动提供精准、高效服务;通过自然语言处理技术理解用户需求,通过语音、文字等多种交互模式,解决用户在使用产品或服务中遇到的问题,以更低的成本为用户提供 24 小时高效满意服务。
3.3.3 智能运营
利用人工智能、大数据等技术,根据客户需求进行精准推荐,提供个性化产品和服务,提升产品和服务质量;利用大数据技术,对内部数据和外部数据深入分析,通过自动化技术将不必要的重复工作自动化,减少成本提高效率。
3.3.4 智能风控
智能风控是金融科技的重要应用领域之一,也是一种精益风险管理模式,通过将大数据、云计算、人工智能等新一代信息技术综合应用到金融业务的风险控制环节,提升风险管理效率,有效降低服务及运营成本,是金融科技通过风险控制环节显现起自身价值的具体体现形式。
3.3.5 智能投顾
综合利用分析、预测、决策技术,为投资者提供个性化的投资建议和资产配置方案。AI 技术会依据对用户风险承受能力、投资目标、投资期限等因素,利用博弈优化算法为用户设计投资组合策略。在 AI 算法的加持下,投资策略会根据用户需求及对市场总体情况的研判进行动态调整,可提升人工投资顾问的服务效率,同时提升投资策略防风险增收益的效果。在智能投顾场景需要解决的预测和决策问题包括。预测问题主要涉及以下几类需要预测的指标:
在预测结果的基础上,需要根据用户的偏好及资金约束等建立决策模型,输出针对性的投资决策。该类技术主要基于博弈及运筹类优化方法,常用优化方法如下:
3.3.6 智能投研
利用先进的数据分析和挖掘技术为专业投资人员(如基金经理、研究员等)的投资研究提供支持。主要是帮助专业投资人员搜集金融数据、挖掘潜在的投资机会、预测市场走势等。智能投研服务的主要目标是提升专业投资人员投资决策的准确性和效率。基于 AI 技术,可以为专业投资人员提供更丰富、清晰、低噪声、高信息含量的数据,还可以在此基础上提供预投资决策相关的投资环境各维度的预测结果,还可以通过实时检测方法提示异常事件,剖析事件形成的原因,推演事件的影响范围及强度。这些信息为专业投资人员的投资研究提供了必不可少的数据支撑。
除了在智能投顾领域需要研判的各类指标走势外,还特别需要关注重点的风险、舆情等相对基础的信息。相对来说,挖掘、预测、归因类方法用处较大,博弈优化类方法利用率较低。
3.3.7 智能监管
以人工智能、大数据技术、云计算技术为支撑丰富金融监管手段,多维度数据分析实现异常交易和风险主体的识别,为监管提供智能化参考依据,提高监管机构应对变化能力。同时,通过区块链和隐私计算技术驱动的智能监管方案,便携性的帮助监管机构改变监管数据采集模式,实现了信息共享,减低了监管成本,避免了数据被伪造篡改及泄露的风险,保证监管合规性。
3.5 技术分析
3.5.1 联邦学习
主要专利情况
目前专利主要聚焦安全与隐私保护方向,以及机器学习、模型训练等方面。全球受理的联邦学习专利数量高达 2 万余件。
应用趋势
目前,联邦学习在金融行业的应用处于框架设计和合作探索的阶段,联邦学习能够实现跨行业和跨机构的数据安全融合,提高金融行业的整体反欺诈和风控能力。经过多年发展,联邦学习在金融行业上主要聚焦于信贷风控、营销风控、零售营销、小微服务、反洗钱监管。例如,在金融反欺诈应用中,借助该技术可以在保护数据安全和用户信息隐私的前提下,联合多个外部机构实现跨行业和跨机构的反欺诈建模。在信贷风控场景中,由于个别机构存在数据稀缺、信息不全面等问题,利用联邦学习技术可以融合多源信息丰富建模特征,共同提升风控能力。虽然联邦学习在金融行业已经形成了典型应用,但未来发展上,产业应在不断磨合和优化的过程中,推动联邦学习步入开放通用的阶段,共同打造联邦数据网络的生态。
3.5.2 多方安全计算
主要专利情况
目前专利主要聚焦数据信息检索、数据保护、加密通信、密钥分发等方面。全球受理的多方安全计算专利数量达 3000 余件。
应用趋势
近年来国内外多方安全计算在金融产业化应用的步伐明显加快。从整体发展情况看,国外多方安全计算产品形态仍处于初级阶段,而国内产品蓬勃发展,形成一定有优势。目前,多方安全计算在金融行业的主要应用场景包括普惠金融、智能风控、智能营销、反洗钱和资产管理等。例如在智能风控场景中,借助多方安全计算可以保护用户信息不泄露的情况下将更多维度数据纳入联合风控模型中,从而构建更加精准的风控模型。多方安全计算是解决数据安全共享的理想技术方案,但在金融行业的落地应用上还存在难点,需要不断探索解决。针对多方安全计算的应用研究分析,未来发展将主要集中在性能优化和应用扩展这两方面。在性能优化上,多方安全计算通常会带来高额的通信和计算成本,在安全模式下保证现实可用的性能是亟需探索的问题。在应用扩展上,多方安全技术实现的应用相对有限,在联合统计和查询上尤为明显,对于一些复杂业务需求的解决能力还有待提升。
3.5.3 可信执行环境
主要专利情况
目前专利主要聚焦可信平台完整性维护、安全通信、内外部计算机组件保护等方面。全球受理的可信执行环境专利数量高达 22 万余件。
应用趋势
可信执行环境是一个涵盖硬件、软件及服务的安全区域,在这个区域内对隐私数据进行计算。在金融行业上的应用主要是通过可信、抗篡改的软硬件为各个金融场景构建一个可信的安全环境。例如,在联合金融风控场景中,需要不同的机构参与提供各自领域的数据进行联合计算,这样容易造成用户信息和数据资产的泄露,利用可信执行环境,不同机构之间可以在不泄露原始数据的前提下联合进行风控评估,提高业务效率和安全性。在未来发展过程中,虽然具备通用性好、性能高等优势,但仍需要进一步提升可信执行环境技术的普及度和可信度。随着国内在重要领域自主可控的要求逐步提高,如何将可信执行环境发展为自主可控的技术并落地金融业务中,成为了未来发展重点关注的话题。
3.5.4 因果推断
主要专利情况
与因果推断相关的专利共 161 篇,研发历程主要分为两个阶段,首先2012年-2017 年为摸索阶段,该阶段专利数均为 2-3 篇,2018 年-2022 年为发展阶段,专利数量迅速提高至 50 篇。
应用趋势
因果推断技术应用范围较广,目前已广泛运用于各大政府机构、金融机构、互联网的策略分析业务之中。因果推断方法从传统计量经济学方法如双重差分模型、合成控制法、断点回归模型等逐渐补充了表示学习、随机因果推动等机器学习模型。
其应用领域由简单的学术评估的归因分析细化分为以下四大研究场景:一、非实验场景策略效果评估:人为创造一个虚拟对照组与策略上线数据做比较估计策略真实效果,如城市政策效果评估;二、实验场景下的正向用户下探:探究策略对于不同用户的异质性影响(HTE),更好的归因和理解不同的用户群,如根据现有高活客户数据进行潜客挖掘。三、策略敏感人群探究,挖掘客户弹性差异化实施优惠政策。四、因果影响指标分析,用于剖析不同变量对政策效果的异质性影响效果。
3.5.5 预测推演
主要专利情况
因为专利法较少保护社会经济领域的技术研究,所以此类技术申请专利较少,发表论文较多。但是工程领域的模拟仿真技术专利申请数量很大,每年约有几千项专利的申请,而且近几年也呈爆发趋势。
应用趋势
在 2000 年后爆发了预测和推演技术的应用热潮。但是目前这些技术还大多停留在学术研究领域,指导实际决策的较少。目前业界在关注了预测对社会经济的应用外,开始逐步头像策略仿真与推演的应用研究。随着数字化转型进程的推荐,数据采集挖掘应用逐渐成熟,决策仿真推演技术将在此基础上发挥重大作用,指导决策者在虚拟系统下进行仿真实验,降低实际试点带来的风险和损失。
应用趋势
数字化转型前期主要是数据采集、结构化处理、分析加工技术的应用。现阶段,数字化将迈向智能化节点,预测及决策(强化+博弈+运筹优化)技术将发挥更加重要的作用。在智能化转型的过程中,一般是先爆发预测需求、进而是模拟推演和决策类的需求。
应用趋势
如前所述,在 2019 年后爆发了广泛的应用需求。但是目前还大多数在游戏领域,真实决策场景下的应用将会在近几年爆发。
应用趋势
如前所述,在 2019 年后爆发了广泛的应用需求。但是目前还大多数在游戏领域,真实决策场景下的应用将会在近几年爆发。基于此类技术,直接服务与社会管理、经济金融系统管理场景智能决策领域的,还没有代表产品出现。
运筹优化是个很大类的技术领域,上图显示的是其中一类方法——鲁棒优化技术的申请情况
应用趋势
该技术应用较多,在路径规划(如美团、滴滴),港口调度、路网交通中有较大的应用。目前已经出现基于此类技术的决策支持产品,这里产品的市场空间巨大,目前刚从起步进入成长期。
3.5.10 多模态算法
主要专利情况
多模态技术在过去几年中取得了显著发展,吸引了众多公司和研究机构的关注。这导致了多模态领域的专利申请数量不断增加。这些专利涵盖了多模态技术在各种场景和应用中的应用,包括计算机视觉、语音识别、自然语言处理、人机交互等。
其中,一些主要的技术巨头,如谷歌(Google)、微软(Microsoft)、苹果(Apple)、亚马逊(Amazon)和腾讯(Tencent),在多模态领域拥有大量的专利。这些公司在多模态技术的研究和开发方面投入了大量资源,以期在智能设备、虚拟助手、自动驾驶等领域取得竞争优势。
多模态技术的专利主要涉及以下几个关键领域:
计算机视觉(Computer Vision):这个领域涉及图像和视频处理技术,用于识别、分析和理解图像内容。专利可能涉及目标检测、场景识别、人脸识别和动作识别等技术。
自然语言处理(Natural Language Processing,NLP):该领域包括文本分析和生成,以及与语言相关的技术。专利可能涉及情感分析、文本摘要、机器翻译、对话系统等应用。
语音识别(Speech Recognition)和语音合成(Speech Synthesis):这些领域涉及音频数据的处理和生成。专利可能包括不同语言和口音的语音识别技术,以及用于生成自然、流畅语音的语音合成技术。
人机交互(Human-Computer Interaction,HCI):这个领域关注如何使计算机系统与用户更自然、更高效地进行交互。专利可能涉及手势识别、触觉反馈、眼动追踪等技术。
多模态融合技术:这个领域关注如何将不同模态的数据结合在一起,实现更高级别的信息提取和表达。专利可能包括多模态数据融合算法、多模态情感识别等应用。
随着技术的发展和应用需求的变化,上述领域可能会出现更多新的专利方向。
应用趋势
多模态技术(Multimodal technology)是一种用于处理多种信息来源的技术,它可以理解、处理、生成和整合来自不同模态(视频图像、声音、文本等)的数据。通过同时分析和整合这些不同类型的数据,多模态技术可以实现更高级别的信息提取、理解及内容生成。
例如,在人工智能(AI)领域,多模态技术越来越多地被用于以下任务:
1. 图像描述(Image Captioning):根据图像内容自动生成描述性文字。
2. 视觉问答(Visual Question Answering):通过分析图像内容和用户提供的文本问题,生成相关的答案。
3. 图像、语音、视频合成(Image,Speech,Video Synthesis):将文本提示转换为相应的图像、音频及视频。
4. 虚拟人(Virtual Being):通过实现具备多模态感知和交流能力的虚拟人,来实现更自然的人机交互系统。
由于人的感知是多模态的,所以多模态技术在许多应用领域具有广泛的应用前景,包括自动驾驶、智能手机应用、虚拟现实(VR)和增强现实(AR)等。利用多模态技术,AI 系统将可以更好地理解现实世界,并为用户提供更丰富、更准确的信息和服务。
2012 年起,声纹识别技术的国内相关专利公开数量呈大幅上升,七年间(2011-2018)已近翻了 10 倍,并一直保持高位水平。
应用趋势
声纹识别有文本相关和文本无关的两种,各自包含声纹确认、声纹辨认两类。
随着 2018 年央行《移动金融基于声纹识别的安全应用技术规范》的颁布,以及 2019 年金融科技产品认证的出台,金融业继续稳居声纹识别产业的第一大民用领域。截止 2020 年下旬,约有 30 家银行机构采购了声纹识别技术产品。(*数据来源于《中国声纹识别产业发展白皮书 2.0》)生物识别技术正逐渐成熟并进入大规模应用阶段。随着3D 传感器的快速普及、多种生物特征的融合,每个设备都能更聪明地“看”和“听”。
生物识别和活体技术也将重塑身份识别和认证,数字身份将成为人的第二张身份证。由于不同场景对生物特征的适应性各有不同,基于多模态的解决方案代表了一个新兴趋势,多生物特征识技术融合已经成为必然。国际标准化组织(ISO)和国际电工委员会(IEC)已经联合公布了《信息技术—生物特征—多模态和其他多生物特征融合》(ISO/IECTR24722∶2007),该方案能融合多种生物指令,以保证在一种生物特征失真的情况下,仍能顺利识别。此外将多种识别方式叠加起来,攻击成本会急剧上升,从而带来安全性上升。这有助于降低金融诈欺所造成的损失,确保用户信息或数据安全。第五代移动通信技术将使移动带宽大幅度增强,提供近百倍于 4G 的峰值速率,促进基于 4K/8K 超高清视频、AR/VR 等沉浸式交互模式的逐步成熟。连接能力将增强至百亿级,带来海量的机器类通信及连接的深度融合。网络向云化、软件化演进,网络可切片成多个相互独立、平行的虚拟子网络,为不同应用提供虚拟专属网络,加上高可靠、低时延、大容量的网络能力,将使车联网、物联网、工业互联网等领域获得全新的技术赋能。语音作为最自然的人机交互方式,将迎来更多成长机会和更大的发展空间。(*数据来源于《中国声纹识别产业发展白皮书 2019》)。
由于声音信号的复杂性,声纹识别在实际应用时仍然面对很多挑战,包括但不限于:背景噪声干扰、跨信道识别、超短语音精度低、假冒攻击等。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
本报告总计:316页。
受篇幅限制,仅列举部分内容!
报告来源公众号:【百家全行业报告】