大模型解析产业链的精度在不断进化
今年来,生成式AI、大模型概念在A股市场持续火热,这也令与AI相关的量化投资成为热点。
7月6日至8日,2023世界人工智能大会(WAIC)在上海举行。期间,宽德投资联合创始人冯鑫在数据智能论坛上表示,AI在量化领域的应用很广泛,包括文本的处理、社交网络分析、图数据库、知识图谱,如果结合GNN(图神经网络)、GAT(图注意网络)。
“不过量化投资不应被神话,也不应被魔化。”冯鑫表示,量化投资不应“唯规模论”,对于资管行业来说,无论公募私募,以及量化还是主观,对投资能力评估是更有效。另外,量化投资要立足长期,不仅要与投资人建立长期的信任关系,也要与监管进行有效沟通。
“当前国内量化投资经过十多年的发展,已进入精耕细作的时代。”黑翼资产创始人邹倚天在上述论坛上介绍,从国内量化投资行业发展历程来看,2012年至2017年,大部分量化管理人仍然主要采用OAS(价值和动量策略)之类的模型;从2017年开始,大量的量化管理人开始使用传统机器学习模型;到了2020年之后,很多管理人都转向深度学习模型。
今年来,随着市场波动加大,量化指数增强策略获取超额收益的难度进一步增大。
在邹倚天看来,随着AI技术的持续发展,各个行业的生产力得到提升,这也为量化投资行业带来新的变革。人工智能经过迭代发展,目前初步实现了感知能力,但在推理、可解释、认知能力上还有待继续提升。未来人工智能的发展重点可能包括四方面:大语言模型,强化学习,知识图谱,以及可解释性的AI。
冯鑫强调粗放式的AI的发展并不可取,比如追短期热点、或者应用在创造力相对较差、重复性工作。他认为,在关注AI技术的同时,也应关注如何让AI有助于社会的发展,注重AI的获得,安全、普惠等。
具体应用方面,大模型解析产业链的精度在不断进化。数库科技创始人兼CEO刘彦在论坛上提到了产业链数据体系SAM(segment analysis & mapping)。据刘彦介绍,SAM典型应用场景之一在于量化投资,可使投资机构年化收益至少提升5%。
具体看来,SAM产业链标签实现了对A股、港股、美股、发债企业等近4万家头部公司公开披露产品的标准化,并将全国近6000万家工商企业与产业链图谱打通,并将各类非结构化数据对齐调精。由于数据标签足够精细,产业链上某个节点的动态、利好以及风险都可能传导至各方并被系统捕捉到。
“如今SAM还在向upg(universal product graph)升级,进一步叠加工艺流程、生产环节、材质、设备等各类关系,数据维度更丰富,从而将实体产业刻画得更精细”刘彦说。
不仅仅是私募领域,当前人工智能行业正面临新一轮产业和科技变革,数据成为新的生产资料,与算力算法并列为新一代人工智能发展的三大要素。
近年来相关政策文件陆续出台,明确要加快培育数据要素市场,引导要素向先进生产力聚焦。2021年党中央、国务院出台了《关于构建更加完善的要素市场化配置体制机制的意见》;2022年12月,中共中央国务院又印发了《关于构建数据基础制度更好发挥数据要素作用的意见》,系统性布局了数据基础制度。
以上海为例,数字经济是上海四大新赛道之一,人工智能是上海三大先导产业之一。该论坛上,上海市经济和信息化委员会信息化推进处处长钱晓也介绍道,上海作为国家大数据综合示范区,始终致力于推动数据产业发展、数据要素市场培育、数字经济红利释放,2022年上海全市数据核心企业突破1200家,核心产业规模近3400亿元,截至目前,在数据交易所累计挂牌的数据产品超过1200个。