在7月4日下午举行的2024世界人工智能大会科学前沿主论坛上,中国科学技术信息研究所联合北京大学共同研制的《2023全球人工智能创新指数报告》发布,这也是这项指数第四次在世界人工智能大会上揭晓。
报告显示,目前全球人工智能发展保持美国全面领先、美中两强引领的总体格局,2023年美国以74.71的总分大幅领先,中国总分为52.69分,排名第二,比排名第三的英国高出近15分。自指数创建五年来,美国一直排名全球第一,中国从2020年起近四年一直排名第二。
大模型、生成式人工智能等新技术新赛道正掀起人工智能科研和产业领域新一轮发展热潮,从数据上看,2018—2022年全球新增人工智能企业数逐年递减,但该趋势在2023年迎来扭转,2023年新增企业数同比上涨21.5%。还有一个细节是,GitHub上发布的生成式人工智能开源项目从2022年的约1.7万个激增到2023年的约6万个,数量约是前一年的3.5倍,新增4.3万个项目。
中国科学技术信息研究所党委书记、中国软科学研究会副理事长赵志耘在发布时介绍,《报告》目标是能够全面客观反映全球人工智能创新发展和治理的发展态势,以及明确中国当前所处的位势,希望从基础支撑、资源与环境、国际合作交流等五大维度,通过构建三层、三级指标体系,对46个重要的国家创新发展和治理的情况进行量化评估。
综合考虑总得分、国家间分差、一级指标排名等因素,报告将参评国家划分为四个梯队。美国和中国稳居第一梯队,总得分明显高于其他国家,第二梯队与第一梯队的差距进一步拉大。英国连续两年位居第二梯队首位,与美国的分差从2022年的26分扩大到2023年的38分,与中国的分差从2022年的9分扩大到2023年的15分。
但报告也提到,第二梯队中,英国在整体教育资源和高质量的学术研究成果方面比较突出,日本专利也较为突出。德国在产业和应用方面,尤其是在人工智能风险投资以及国内市场规模方面很有优势。
第三、四梯队部分国家有所进步。其中印度和沙特阿拉伯连续三年排位上升。第四梯队国家中,大多数国家相对有较弱势的项目,但是也有一些进展。如巴西和印度尼西亚等个别国家,在科技研发和产业应用等层面有明显的进步,特别是在人工智能开源项目数量和人工智能风险投资等方面,这两个国家排在中等以上的水平。
统观当下全球人工智能创新发展趋势,赵志耘提到了四个特点。一方面,大模型突破带动了人工智能技术创新加快,自然语言处理和多模态等在人工智能创新发展中起到非常重要的作用,2023年全球发布的机器学习模型数量同比增加91.2%,达到近十年来最大增幅。其次,产业界在模型开发上的领先优势在不断扩大,2023年产业界独立研发的机器学习模型达176个,为学术界的3.5倍。三是生成式人工智能开源项目的数量激增,GitHub上发布的生成式人工智能开源项目从2022年的约1.7万个激增到2023年的约6万个。
关于第四个特点,赵志耘提到人工智能企业新增数量开始增长,创业、创投低迷的趋势有所转变,“这个特点非常明显”。在过去的2018-2022年,全球新增人工智能企业数量在逐年递减,但是这种递减趋势在2023年得到了抑制,同时有回转的倾向,2023年新增企业数量同比上涨了21.5%。
同时有一个更为乐观的趋势是,全球人工智能风险投资额虽然还是下降的趋势,但是这种下降的幅度在明显缩减。尤其是2023年生成式人工智能的风险投资规模在快速扩大,也使得生成式人工智能在推动人工智能创新发展方面起到非常重要的作用。
目光看向中国,在全球人工智能发展上,中国的综合水平保持了全球第二的水平,在人才培养和科研产出、产业发展等方面,近些年来取得明显的进展。高层次人才数量与美国的差距逐渐缩小,顶会顶刊论文、高影响力人工智能开源项目等高质量科研成果数量明显上升,人工智能企业数量和风险投资额保持全球第二。
但从当前主流技术路线的趋势特征以及支撑技术大规模应用的基础条件看,中国人工智能发展还存在一些不足,尤其在数据开发利用、原始创新等方面需要进一步加强。
高质量数据资源缺乏的一个侧面是,在Hugging Face上的开源训练数据集中,中文数据集仅占5.1%,不到英文数据集的十分之一。其次重大引领性创新产出不及美国,2019-2023年全球发布的387个重要的机器学习模型中,美国机构主导开发的达262个,中国占68个。
赵志耘提到,希望加快高水平规模化的应用,这是中国最大的优势。