5月26日,2023年中关村论坛人工智能开放生态建设分论坛在京举办。与会专家表示,我国人工智能产业经过快速发展,已初步形成了应用导向、场景驱动、技术支撑的人工智能发展生态。为了不断寻求在通用人工智能技术方面的突破,补齐底层算法、关键软硬件和生态体系建设短板,我国人工智能产业仍需进一步加强开源开放合作。
从AI算力、大模型、数据集到应用层面,人工智能企业正广泛参与人工智能开源生态建设,共同促进人工智能技术与产业发展繁荣。
● 本报记者 彭思雨
开源成创新强大动能
“人工智能已经成为引领未来发展方向的核心驱动力。”新一代人工智能产业技术创新战略联盟(AITISA)秘书长黄铁军表示,当前社会生产生活中的各种活动都在极大发挥人的智力,而人工智能作为解放人的智力的技术手段,将推动社会前进和发展。
科技部高新司副司长、一级巡视员梅建平表示,我国人工智能产业经过快速发展,已初步形成了应用导向、场景驱动、技术支撑的人工智能发展生态。
梅建平坦言,我国在底层算法、关键软硬件和生态体系等方面与国际先进水平还存在着较大的差距,这些问题需要科技界、产业界携起手来共同破解。
在此次论坛上,与会专家共同探讨了如何能够利用开源模式推动我国人工智能技术水平提升,推动人工智能产业加快发展。
中国科学院院士、CCF开源发展委员会主任王怀民认为,国际IT产业从芯片、操作系统、数据库到中间件,乃至于“云、边、端”的软件和设备发展过程中,开源模式是一种非常有竞争力的形态。他引用谷歌内部报告称,大模型的发展要依靠更多开发者的参与,通过快速迭代来完成。这样一种创新生态是人工智能未来发展的最大优势所在,能够提供更强大功能。
“ChatGPT让全球看到了大模型推动通用人工智能取得突破的可能性。但随着Open AI将GPT大模型闭源,业内掀起的大模型热潮激发了大模型开源模式的发展。”王怀民表示,过去5年,全球范围出现了参数量超过百亿的大模型约45个,32个出现在美国,9个出现在中国,还有4个出现在欧洲。其中,美国有15个是开源的,中国有5个大模型已经开源。“ChatGPT不开源了,但是Meta把LLaMA模型进行开源,迅速吸引了大量开发者,这和互联网时代Linux开源状态非常相似。”
不仅在大模型方面,算力发展也需要依托开源模式。AITISA智能算力中心和智算网络工作组负责人余跃表示,人工智能的快速发展和应用推动算力需求不断快速增长,但当前算力不足和算力高质量发展能力不足,亟需更高水平的协同来推动算力基础设施建设,以支持类似ChatGPT这样的新兴人工智能应用。
推动企业与生态共荣
王怀民表示,过去大家总认为开源是学术界开放共享知识产品的一种价值观,而闭源是支持软件商业发展的有效模式。如今能够看到,开源实践已经推动一种面向服务的产业生态,形成了互联网时代基于众包的创新模式。“因此,一旦将开源运用好,既能够支持创新,也能够有效地兼容商业领域的创业实践。”
我国人工智能企业正积极参与人工智能开源生态建设。华为昇腾计算业务CTO周斌表示,华为基于华为全栈“昇腾+昇思”软硬件整合能力,支持适配AI开源大模型。“目前已和9个开源大模型,以及正在研发的开源大模型进行全链适配,能够让合作伙伴在基础软硬件能力方面不用花费过多成本,快速进入到大模型时代。”
北京海致科技集团有限公司CEO杨再飞表示,在电网项目中,公司通过开源大模型来协助知识图谱完成知识的抽取、推理和融合,大模型和知识图谱构成了取长补短的关系。比如,知识图谱具备可靠性高、可解释性强、复杂推理能力强的特点,恰恰弥补了大模型在这些方面的不足。反之,知识图谱所不具备的标注、知识融合成本低的特质也是大模型的优点。
值得一提的是,海天瑞声CEO王晓东在会上宣布,开放DOTS-MM-0526多模态数据集,这个数据集将包括语音、音频、视频、文本等信息,支持以数据驱动的生成式AI业务发展。
据了解,在科技部牵头下,我国数据、算力、算法等人工智能基础设施开源开放建设成果显著。梅建平表示,国家新一代人工智能发展规划将开源、开放作为基本原则写入,科技部启动实施科技创新2030新一代人工智能重大项目,引导鼓励国家项目支持研发成果开放共享,依托人工智能头部企业建设国家新一代人工智能开放创新平台,在构建开放生态、推动行业发展等方面产生积极的反响。推进国家公共算力平台和中国算力网建设,推动数据、算力、算法等要素共享与流通打造算力基座。
“我们要提高生态位,就必须打造一个开源开放的舞台,在剧场上演绎具有世界影响力的中国剧目。”王怀民称。