大模型作为通用赋能工具,引发智能时代革命性变革。拥有海量参数的大模型在大数据、大算力加持下,能够通过细微的调整优化应用至不同行业中,大幅提升场景适应性和应用落地能力,这标志着人工智能在从专用智能向通用智能演进的道路上实现了重大突破。作为具有全球共识的颠覆性技术方向,大模型极具理论研究与应用创新价值。
大模型的成功建立在“巨资+巨头+人才”的强势资源联合基础上,资源投入巨大。据测算,ChatGPT自建算力平台的固定成本约为8亿美元,训练1次耗时1个月,成本超过1200万美元。目前,OpenAI已累计投入40亿美元,并计划在未来几年增投100亿美元。美国业界巨头也给ChatGPT大量支持。微软为ChatGPT提供了庞大的算力服务,马斯克曾推动OpenAI、特斯拉、SpaceX联合开展人工智能技术攻关,领英创始人霍夫曼帮助OpenAI网罗大量人才。ChatGPT的成功得益于奥尔特曼、莎士科尔等天才人物参与,以及一批具有斯坦福、哈佛、麻省理工等知名高校教育背景的精英人才。回顾ChatGPT发展历程,巨资、巨头、人才缺一不可,目前仅有谷歌、微软、Meta等少数领军企业具备“从零开始”研发训练和部署推广大模型的能力。
我国技术、资本、人才等资源正在快速涌入大模型“赛道”。企业、高校及科研机构快速跟进,短时间内布局了一批大模型技术产品。目前行业内出现了四类竞争主体。
一是互联网领军企业。如百度推出文心系列大模型,在自然语言处理、多模态、视觉、行业大模型等方面均有布局;阿里通义系列大模型覆盖自然语言处理、多模态、计算机视觉能力,已逐步在阿里电商、智能家居、文娱等场景投入使用。
二是人工智能创新企业。如商汤推出“日日新SenseNova”大模型体系,支持代码编写、文案创作、文档处理、多模态生成等服务;科大讯飞在其讯飞开放平台中新增星火认知大模型能力,支持文本生成、语言理解、知识问答、逻辑推理、数学、代码、多模态等多类任务。
三是高校及科研机构。如中国科学院自动化大模型紫东太初2.0,融入3D点云、视频、信号等更多模态数据,在问答对话等能力之外加入3D理解、信号分析等技术能力。
四是传统行业企业。如中国农业银行推出ChatABC,对内部金融问答场景进行测试;中国移动发布“九天·海算政务大模型”和“九天·客服大模型”两款行业大模型。
在大模型产业生态发展壮大过程中,仍需系统布局、有序引导。大模型作为短时间内快速崛起的新技术、新业态,有望对研发生产模式和社会运转方式带来一系列颠覆性变革,但由于其技术演进路径仍未定型、应用场景尚未明确、监管治理面临诸多挑战,建议从以下四方面突破。
一是高度重视大模型引发的安全治理风险,加强人工智能发展的潜在风险研判。
二是推动建立大模型公共服务平台,为产业上下游提供服务,推动我国大模型产业生态共建共享,形成并发挥合力。
三是加快融合赋能应用,推动大模型在工业、能源、金融、交通等领域高价值场景落地,形成示范推广效应。
四是统筹规划建设算力、数据等基础资源池,加强现有算力和数据等资源归集调度,推动算力和数据高水平开放共享,提升存量资源利用率,加快构建云边端协同、“算存运”融合的一体化、多层次算力基础设施体系。
*本文刊载于《通信世界》
总第924期 2023年7月25日 第14期
原文标题:《大模型发展仍需系统布局、有序引导》
END
作者:中国信通院信息化与工业化融合研究所
人工智能研究部副主任 李论
责编/版式:甄清岚
审核:舒文琼
监制:刘启诚
三连一下,了解更多精彩内容