文心一言、ChatGPT等大语言模型热度空前,引发全球创新浪潮。人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。加快发展人工智能技术,有助于提升科技竞争力、推进经济高质量发展。近日,深度学习技术及应用国家工程研究中心主任、百度首席技术官王海峰做客CCTV-10《创新中国说》,展示大语言模型文心一言的能力,阐述人工智能技术原理、重大战略意义及产业应用。从技术创新到产业落地,抽丝剥茧,为观众揭秘人工智能。
像奥运选手那样去拼搏搞研发
节目中,文心一言作为“特殊嘉宾”登台,先是为《创新中国说》生成了一篇片花词,简短精炼有文采,随后还为节目绘制了一张海报,科技感十足。文心一言顺利完成任务,背后的技术原理是什么?
据了解,文心一言是百度自主研发的知识增强大语言模型,能够根据用户的输入,生成符合需求的内容。
王海峰介绍,从技术原理上讲,首先基于深度神经网络,融合海量数据和知识,进行知识增强的学习,得到预训练大模型。然后采用有监督精调、人类反馈的强化学习、提示等关键技术,让大语言模型生成的内容更符合人的规范、习惯和价值观。文心一言具备知识增强、检索增强、对话增强等独特技术优势,生成内容准确性更高、时效性更好、逻辑更清晰。
王海峰把文心一言的研发类比为参加奥运会,他认为技术创新过程就是要挑战没人做过的事。百度在全球科技大厂中率先推出对标ChatGPT的大语言模型,就像1932年洛杉矶奥运赛场上,刘长春万里关山,单刀赴会,代表中国第一次站在奥运赛场。直到1984年,许海峰在洛杉矶为中国获得第一枚奥运会金牌。“中国奥运52年走过的路,我们希望52周完成。我们不仅要做1932年的刘长春,还要做1984年的许海峰,要迅速进步,最终拿到奥运冠军。”
如今,这一目标已在文心大模型的迭代升级中离我们越来越近。据悉,文心一言的基础模型已升级到文心大模型3.5,训练速度达到原来的3倍,推理速度达到原来的30多倍。
据人民数据、新华网等多个公开测评,文心大模型3.5支持下的文心一言综合能力超过ChatGPT,遥遥领先于国内其他大模型。IDC最新发布的《AI大模型技术能力评估报告,2023》显示,文心大模型3.5拿下12项指标的7个满分,得到“综合评分第一,算法模型第一,行业覆盖第一”三个绝对第一。
人工智能已进入工业大生产阶段
“十四五”规划《纲要》强调应加强原创性引领性科技攻关,特别指出要瞄准人工智能等前沿领域。围绕关键核心技术突破、经济社会发展、素质教育人才培养三个方面,人工智能均是重点领域。
王海峰指出,纵观人类经历的三次工业革命,其核心驱动力量机械技术、电气技术和信息技术都有很强的通用性,当它们呈现出标准化、自动化和模块化的工业大生产特征,核心技术就进入工业大生产阶段。“当前的人工智能技术也具有很强的通用性,显现了标准化、模块化、自动化的特征。人工智能已经进入工业大生产阶段,广泛应用于各行各业,成为科技革命和产业变革的重要驱动力量。”
王海峰进一步解读,“在前三次工业革命中,我国只是追赶者和跟随者,没有掌握住核心科技,失去了一些发展机遇。而在当下以人工智能为核心科技的第四次工业革命中,我国有机会和科技强国同场竞技,在一些领域成为领导者。对我国来讲,这是一个非常重大的历史机遇。”
放眼全球,我国在人工智能领域基本处于第一梯队。在基础理论方面略有不足,在关键核心技术上处于并跑局面,在产业应用上各有优势。我国的产业体系品类齐全、体量庞大,人工智能技术有丰富的应用场景,赋能产业的转型升级。
例如在交通领域,通过引入智能化的路网监控指挥系统,给道路装上“慧眼”,准确捕捉路面实时情况的数据,实时上传到“交通大脑”,对整个区域的交通流量进行感知、预测和控制优化,实现对全域路网的宏观调整。特别是让红绿灯切换和时长更合理,提升城市的交通效率。
在畜牧业,开启“人工智能相牛”探索,将“相牛人”的经验转换为深度学习算法,让机器也能一眼识别出牛的体重和体尺,进而让活牛交易更加标准化、流程化,提高效率的同时,更好地保障牧民收益。
在能源领域,输电智慧管控系统从发现异常,到定位故障点,排查时间缩短到几分钟,实现了集中监控、统一管理、高效调度,革新了电网的巡检模式,解决了人工巡检耗时又费力的问题,帮助能源行业更安全、更经济。
中国工程院院士邬贺铨曾表示,以搜索引擎起家的百度公司,人工智能是其内在的基因,海量大数据的积累是其优势,在大模型上深耕多年,现在到了将大模型与垂直行业应用结合的时候了。
随着文心一言进一步落地,这类大语言模型会成为一个通用的赋能平台,金融、能源、媒体、政务等各行业各领域都可以基于文心一言实现智能化变革,提高效率,推动我国人工智能产业加速发展,促进科技进步、产业升级和生产力整体跃迁,为我国经济高质量发展注入动能。
点击阅读原文,观看完整节目