随着ChatGPT的火爆,AI产业今年开始进入新的阶段。
在2015年前,人工智能发展以小模型为主导地位,能够较好地适应在垂直领域的分析任务,但是在通用交互相关的任务上,由于表达和理解能力欠缺,无法完成生成类的任务。但随着计算机深度学习模型的进展,同时算力成本降低,逐渐开始探索并训练大语言模型。
可以说大模型的出现,大家才真正看到人工智能的影子。大模型提高了人工智能的水平和范围,使得人工智能能够处理更复杂和多样的语言问题,如文本理解、生成、翻译、摘要、问答等。它极大地推动了人工智能的创新和想象,马化腾表示“这是几百年不遇的、类似发明电的工业革命一样的机遇。”
AI已经是战略上的必争之地,小到企业大到国家。
一、产业环境竞争
当前,美国、中国、欧洲、以色列、加拿大等国家和地区都在AI领域展开激烈的竞争。
美国作为AI的重要发源地,拥有众多技术巨头和顶尖研究机构,一直保持着领先地位。中国则通过国家战略和大力投资,迅速崛起成为全球AI领域的重要力量。欧洲和其他国家也在加大投入,试图缩小与美中两国的差距。
7月7日由中国科学技术信息研究所研制的《2022全球人工智能创新指数报告》发布,报告显示,当前全球人工智能发展总格局是由中美两国引领、多国呈梯次分布的格局。
按照2022年人工智能创新指数得分排名,可将46个参评国家分为四大梯队。
第一梯队国家得分为50分以上,只有美国和中国进入。美国的得分已连续四年位居全球第一,中国连续三年保持全球第二水平。第二梯队国家得分为35~50分,包含英国、德国、新加坡等11个国家。第三梯队国家得分为20~35分,包括丹麦、芬兰等12个国家。第四梯队国家得分为20分以下,包括捷克、巴西等21个国家。
如果单看分数看起来有些绝对,其实AI产业的竞争格局是一个多极化和分化的现象,不同的国家和地区在AI产业中有不同的优势和特色。
例如美国在AI基础研究、创新能力、人才培养等方面领先;中国在AI应用场景、数据规模、市场潜力等方面领先,在人才、教育、专利产出等方面有所进步,但基础资源建设水平仍有待提高;欧盟在AI伦理、法律、标准等方面领先;其他国家和地区如日本、韩国、印度、以色列等在某些细分领域也都有突出表现。
整体来看,在今年ChatGPT发酵之前,全球就在AI领域持续积累。各国都在积极培育本土AI产业,努力形成完整的AI产业链,以确保在全球竞争中有更强的话语权。
2022年,参评国家的人工智能企业总数和人工智能从业人口总数继续增长,且增幅均有所扩大。人工智能企业总数同比增长25%,高于2021年的18%;人工智能从业人口总数同比增长53%,显著高于2021年的10%。
从重要的基础建设数据中心的数量看,近三年参评国家托管型数据中心总量持续增长,其中有三分之一的国家相比2020年增长了10%以上。美国、英国、德国等国家进入全球500强的超算数量持续增加。激烈的竞争下,中国在超算上的优势反而有所减弱,中国超算占全球比重从2020年的45%下降到2022年的35%。
无疑世界各国对AI的重视已经到了空前的高度。该报告对于各国在政策完备性和人工智能治理的重视程度也进行了评分。
根据报告,相比2021年,无论是人工智能创新制度一级指标,还是政策规划和治理两个二级指标,2022年几乎所有参评国家的分数都有所增加。其中,英国、新加坡、美国、中国、澳大利亚五个国家的政策规划得分提高最多,英国、新加坡、法国、澳大利亚、日本五个国家的治理得分提高最多。
此外,值得一提的是,中国在AI论文数量上占据了绝对的优势。据斯坦福大学发布的《2023 年 AI 指数报告》统计,人工智能论文的总数自2010年呈现翻倍增长,从2010年的20万篇增长到2021年的近50万篇(49601),中国保持领先地位,2021年占比为 39.8%,其次是欧盟和英国(15.1%)与美国(10% )。
二、算力竞赛
ChatGPT爆发后,算力是涨的最好的板块之一。
作为AI环境的基础建设,算力需求的确定性要远大于AI产业链的其他板块。算力成为AI发展的关键基石是产业的新共识。
根据国盛数据,历代GPT参数量呈现指数级增长。训练一次1750亿参数的GPT-3模型需要的算力约为 3640 PFlop/s-day(即假如每秒计算一千万亿次,需要计算 3640 天)。但这算力消耗速度很快被新一代模型刷新。GPT-4 不仅支持文本输入,还支持图像输入,文字输入限制提升至 2.5 万单词,所需计算规模大幅提升。
而根据 OpenAI 统计,AI 训练任务中的算力增长(所需算力每 3.5个月翻一倍)已经超越摩尔定律(晶体管数量每 18 月翻一倍)。
中国信通院《中国算力发展指数白皮书》测算,2021 年全球算力规模超过615EFLOPS(1 个 EFLOPS 代表 10^18FLOPS),同比增速高达44%左右,而后续几年则将迎来算力引爆时代。信通院报告预测,2030年全球算力规模有望达56ZFLOPS,2022-2030年复合增长率达65%。
有趣的是,世界各国对于算力的布局情况与GPD正相关,属于相互影响的关系。根据IDC的报告,计算力指数平均每提高1个点,数字经济和GDP将分别增长3.3‰和1.8‰
2021年算力规模前20的国家中有17个是全球排名前20的经济体,中美遥遥领先。美国、中国、欧洲、日本在全球算力规模中的份额分别为 34%、33%、14%和 5%,其中全球基础算力美国份额达37%,中国以 26%份额排名第二;智能算力方面,中国、美国分别占比为 45%和 28%;美国、日本、中国在超级计算综合性能指标方面份额分别为48%、22%、18%。
AI对于整个算力产业需求的拉动将会非常显著,而最重要最基础的算力竞争在于芯片。
面对数据中心海量数据处理工作,传统CPU计算结构越来越难满足需求,辅助CPU进行数据运算的协处理器应运而生。运算协处理器基于不同设计架构存在多条技术路线,包括通用GPU(GPGPU)、FPGA、ASIC 等,它们是目前主流的AI芯片类型。
GPU是图形处理器,最初用于图形渲染,但后来被发现非常适合神经网络训练和推理。GPU具有大量的并行计算能力,这使其能够快速处理大量数据。
FPGA是现场可编程门阵列,是一种可以重新编程以适应不同应用的芯片。FPGA具有灵活性和可编程性,这使其非常适合开发新的AI算法。
ASIC是专用集成电路,是一种专门为特定应用设计和制造的芯片。ASIC具有高性能和低功耗,这使其非常适合部署在边缘设备上的AI应用。
GPU 凭借强通用性和完善软件生态系统成为该领域的主流解决方案。据 IDC数据,2021年我国搭载GPU服务器销售额占据 AI 加速服务器市场的 88.4%,远超搭载ASIC、FPGA等服务器。
2022年CPU市场规模约 249 亿美元。从市场竞争格局来看,Intel 和 AMD 两家占据市场主要份额,其中英特尔凭借至强系列市场份额维持在 60%以上,AMD 市场份额持续提升。根据 IDC 数据,2Q22 英特尔和AMD 服务器 CPU 全球出货量份额分别约为 63.7%和 29.2%,合计占据全球市场 89.9%的份额。
最关键的GPU市场,英伟达和AMD基本包揽全场,英伟达占据垄断级别的优势,而英特尔占比极小。根据JPR的数据,2022年Q3独立显卡市场份额:英伟达占据 88%,AMD 占 8%,英特尔为 4%。华泰估算2022年独立GPU市场规模超166亿美元。
从区域市场发展水平来看,美国凭借英伟达、AMD、英特尔三巨头霸占全球GPU芯片研发领域的主导地位;欧盟、日本、韩国处于第二梯队,欧盟、英国拥有先进的芯片设备制造技术,日本、韩国凭借领先的半导体材料研发和制造技术等优势抢占市场份额;而以中国为代表的发展中国家还在努力追赶中。
三、百模大战
2022年11月,OpenAI发布聊天机器人ChatGPT,点燃生成式AI的燎原战火。2023年,全球AI布局加速,在AI大浪潮下,国内外科技厂商纷纷入局,密集上线大模型。
2023年2月,Meta AI在其官网公开发布了LLaMA大型语言模型。5月,Google 发布新一代大语言模型PaLM2。国内方面,百度于3月发布文心大模型。随后,商汤、阿里云、科大讯飞、华为等陆续发布各自的大模型。
AI 行业呈现出“百模大战”的格局,战局非常混乱,几乎所有的科技平台龙头都积极下场参与。
AI 大模型是一个资本密集,人才密集和数据密集的产业。千亿级参数模型训练一次成本就超过1200万美元,可以看得出来这是平台之战。国外大模型PaLM-E、Visual ChatGPT、GPT-4 的模型参数量分别为 5620亿,1750 亿和1750亿。国内大模型中,模型参数数量达千亿的模型有文心大模型(2600 亿),盘古 NLP (千亿级)等。
是否拥有大语言模型将成为衡量科技企业甚至衡量国家综合实力的重要尺度之一,而更远的竞争在于掌握全球AI产业的主导权和主动权。赢得大模型之战,后续AI很多相关的发展都可能在它的框架之下运作,AI+下半场有望演绎以大模型为入口向终端应用扩散的过程,类似于AI时代的“App Store”。
未来的日子,AI领域的节奏会逐步加快。例如类安卓系统的AI路线,Meta已经想快速抢占坑位。7月19日,Meta发布最新AI大语言模型LLaMa2系列,模型信息和起始代码全部开源,并支持免费可商用。相较于今年2月发布的LLaMa1,最新LLaMa2训练所用的token翻了一倍至2万亿。同时,Meta还宣布与微软、高通公司展开合作,LLaMa2将部署在微软云服务Azure上,同时LLaMa2将能在高通芯片上运行,打破市场上英伟达、AMD处理器对AI算力市场的垄断。
虽然现在大模型格局模糊不清,但参考过去科技产业的发展,未来可能只会剩下国内外各数家的寡头竞争格局。
四、结语
从产业孵化环境,到算力基础建设,再到底层大模型,是AI竞赛最火热也是最重要的几个领域。
无论AI未来以什么形式存在,底层的东西需要把握在手里。