导语
近年来,深度学习、自然语言处理、计算机视觉等技术不断突破,AI性能得到长足发展,推动了AI在各个行业的应用,多模态AI、ChatGPT、AIGC等概念爆火,吸引了大量投资者的关注。在金融行业,近年来市场对量化基金的关注度不断提高,但很多投资者朋友对AI量化还比较陌生。
量化策略是如何获取超额收益的?AI量化策略是如何运作的?把目光转向投资,人工智能与量化投资策略会碰撞出什么火花?泓德基金将就以上问题展开分享。
相比主动投资,量化投资到底是什么?
在市场并不完全有效的前提下,量化投资者认为可以通过对数据的演算来预测资产未来的走势或偏离,从而挖掘市场中潜在的投资机会。依靠计算机完成因子构建、模型搭建、交易、风控等其中一个或多个流程,将大量数据放入模型不断进行运算,并根据市场实际情况进行对比修正,最终依托机器和模型计算出的结果进行资产价格预测和买卖交易。量化投资具有更严格、更分散、交易频率较高等特点。
无论是量化投资,还是其它的投资,本质都是一个Y=F(X)的过程。Y就是想预测的股票投资收益。X就是影响Y的变量因子。F就是用什么样的方式去提炼这些指标中的数据。在过去,像“市值”、“成长”都是X,F就是一个线性加权的模型。到了现在,X还包含很多交易的信息,甚至一些人的行为信息等等。F从之前线性的模型,现在提炼到很多机器学习、神经网络的模型里去。
X和F这两块也是相辅相成的,我们现在的逻辑是,用什么样的方法,把现在有的这些特征提取出对未来有效的预测或者判断的关键信息。最终预测的结果可能是这只股票未来一段时间的涨跌幅或者涨跌幅的稳定性等等。
量化策略作为一种投资策略,目标是获取绝对收益或者是超越市场平均收益的相对收益。在投资中,非常需要理解的一个要点是收益来源的区分。一般来说,我们的投资策略的收益率都可以分为两部分:一个与市场基准完全相关,另一个与市场基准不相关。不相关的就是Alpha,而Beta收益就是与市场完全相关的那部分收益。通俗点说,跑赢对标指数的部分就叫alpha,跟着指数起伏的就叫beta。在理解了这一概念之后,我们可以把国内公募量化策略大致分为三类:指数增强、主动量化和量化对冲。
具体什么是指数增强、主动量化和量化对冲基金?
指数增强基金通常要求基金管理人在紧密跟踪基准指数的同时获取超越基准的稳定超额收益。 这类产品对于跟踪误差在合同中通常有比较严格的研究,alpha的稳定性这类产品的核心竞争力。 从策略定位来看,指数增强策略旨在通过量化的手段,在股票组合中通过量化模型交易,获取超越指数的投资收益,在指数上涨的市场收益更上一层楼,在指数下跌的市场减少亏损。
主动量化选股策略放宽了对于跟踪指数的限定,去掉了锚定的指数,相当于同时放宽了选股的范围,从跟踪指数变成了真正的全市场选股。投资目标也从尽量的超越指数,转变成力争最大化超额为目标。
量化对冲策略与指数增强策略类似,也会对标指数构建一揽子股票组合,但会通过股指期货、融券等形式,构建相应指数的空头头寸(持有空头头寸可以简单理解为投资者空头部分获得的收益将与指数的涨跌相反),从而对冲掉指数涨跌带来的β(Beta),达到“中性”的目的。在对冲掉指数的β之后,整个股票组合就只剩下了通过量化投资模型和计算机的运算,对组合内股票价格进行预测和买卖交易获取的超额收益α(Alpha)和为了对冲而产生的对冲成本。
作为管理人,核心能力来源于获取超额收益,也就是创造α的能力。有能力获取稳定超额收益的能力是非常稀缺的,且随着市场越成熟,越难挖掘α因子,因此我们需要用做学术研究般科学严谨的态度来不断提升自己获取α的能力。
量化模型如何获取超额收益?
常见主流的量化策略有以下几类:比如多因子模型、统计套利、事件驱动、还有逐渐兴起的人工智能端到端的模型等等。
多因子模型将组合投资看作因子的组合,投资组合的风险/收益被拆解为一系列因子,包括基本面因子、技术面因子、事件驱动因子,比如估值、盈利、流动性、市场情绪等。模型通过对历史数据的分析,筛选出影响股票价格波动的因子,并量化成各种数据指标,精准配置因子权重,优化出一揽子股票组合。因子的背后反映出金融市场的一些特征和规律,比如价值因子意味着目前估值低的股票更容易涨、成长因子意味着维持高增长的公司的股票更容易涨等。
统计套利模型主要基于对历史数据(估值、财务数据等)的统计分析,对各类交易特征构建概率分布图谱,从而对标的当前市场价格与均值溢价形成实时判断,通过自动交易实现价差套利。
事件驱动策略则是对于市场中不确定的事件性机会,通过数学方法预测事件发生的时点和市场可能的反应,提前布局获取收益。常见事件比如上市公司发布季报、年报,国家颁布重大政策时。
近些年兴起的人工智能策略,也在对量化投资领域进行多种多样的赋能。有一些量化策略会挖掘人工智能因子将其纳入多因子模型中,而另一种方法则是采用纯端到端的策略力争获取超额收益。在我们的量化产品和量化策略当中,其实是很新的技术尝试。
AI量化策略是如何发展迭代的?
在AI用于量化投资上,数据、算法、算力这三个因素至关重要。从传统量化的线性模型,到现在的比如端到端的深度学习模型,数据使用量大幅增加,需要的算力可能也会变大,在模型的维度上来讲相对也更加复杂。
从策略的发展迭代来看,第一阶段,从开始0到1的过程中,在这个阶段,所需的资源投入相对较少,不需要大量的算力或数据,模型也不必过于复杂,就能看到立竿见影的效果。
第二阶段,从1到10的过程,这个阶段需要更多的模型、数据和算力,但边际效果的提升相比初始阶段会更弱一些。
第三阶段,可能涉及大规模的参数调整和模型泛化能力的提升,甚至构建更大的模型。尽管需要更多的算力,但投入与效果之间并非总是线性关系,意味着算力和数据量的增加并不一定直接导致效果的线性提升。
AI选股的优势有哪些?
第一,AI选股能够更好地处理高频数据。第二,AI选股更能挖掘金融市场的非线性特征。金融市场非常复杂,更适合用 AI或者是神经网络的方式去挖掘这些特征。总的来说,在挖掘阿尔法方面,AI模型更准确、高效,挖掘角度更多元。
AI选股模型如何争取更高alpha,又如何保持其可持续性?
有两种途径可以力争获得更高的超额,一个是获取更多信息,并提取信噪比更高的信息。另一个是采用更先进的方式,不断迭代AI模型、训练神经网络,得到更好的结果。
而对于保持阿尔法有效性,唯一的方法就快速迭代模型。机器学习的数据源更多来自交易信息,从错误定价中获取超额收益,加快神经网络的训练频率,可能会带来更好的稳定性。
现在能代表全市场、行业覆盖全、行业均衡的指数还比较少,除了最近非常火热的中证A500,还有一个中证全指指数。请介绍一下中证全指指数特点?
中证全指成分股平均市值192.64亿元。可以充分反映中国股市的整体表现,而中证A500整体偏向大市值风格,成分股平均市值更大,达到1065.76亿元。中证全指样本数量涵盖了A股市场超过91%的上市公司,成份股的市值总额占A股总市值的比例超过97%,而中证A500指数从各行业选取市值较大、流动性较好的500只证券作为指数样本。
长期看,中证全指历史表现优异,自基日以来累计涨幅384.59%,显著优于沪深300、中证800等市场指数,夏普比例、最大回撤、年化波动率等多项指标表现在宽基指数中也相对较优,配置价值较高。
中证全指代表的是A股的贝塔,不仅全市场选股投资域更宽,指数的行业风格也具有一定的分散性,更适合AI量化进行投资。近年来,市场风格的转变难以预测,对于投资者而言,如果未来一年无法预测是大盘好还是小盘好,可以全市场更广范围选股的中证全指更加适合当下情景,不惧大小盘风格切换。
数据来源:WIND,数据截至20241031。风险提示:本材料中的观点和判断仅供参考,不构成投资、法律、会计或税务的最终操作建议或实际的投资结果。本基金管理人不保证其中的观点和判断不会发生任何调整或变更,且不就材料中的内容对最终操作建议做出任何担保。投资有风险,入市须谨慎。基金产品由基金管理公司发行与管理,销售机构不承担产品的投资、兑付风险管理责任。
来源:泓德基金
免责声明:本文为转载内容,不代表本刊立场,亦不构成投资建议。