自2023年8月百度发布飞桨星河社区以来,已推出了超4000个基于文心大模型的创新AI应用
临洮县水务局与百度智能云共同搭建了国内首个“人工智能防溺水应急救援体系”,上线当月,防溺水系统第一个生命救援成功,至今以来已成功阻止多起高危行为
文 |《瞭望》新闻周刊记者 扈永顺
“安装人工耳蜗后,能不能用AI帮学说话?”由于遗传原因,来自内蒙古的李朋程出生时便失去听力,安装人工耳蜗后,还要负担一笔“学说话”费用,因为安装人工耳蜗后并不能马上听懂别人在说什么,要想通过康复师学习说话,“一个月最少需要5000元,很多人负担不起。”
李朋程的需求在“声桥AI语训”团队得到了解决。该团队负责人唐璇说,他们设计了一款利用AI技术帮助听障人士进行纠音的产品,“通过识别听障人士的语音,针对其中不清楚或错误的部分,用AI给出具体建议,指导他们修改和进步,降低了学习说话的成本。”
“声桥AI语训”帮助听障人士学习说话的能力,来自百度文心一言大语言模型的功能延伸。当前,基于强算法、大算力和大数据的大模型成为人工智能发展的主流方向,为人工智能技术及应用提供了新基座。
近日,在WAVE SUMMIT+深度学习开发者大会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰公布了推进AI价值创造的最新进展:文心一言用户规模突破1亿;截至2023年12月底,飞桨已凝聚1070万开发者,服务23.5万家企事业单位,基于飞桨创建了86万个模型;自2023年8月百度发布飞桨星河社区以来,已推出了超4000个基于文心大模型的创新AI应用,“声桥AI语训”就是其中之一。
大模型基础逐步夯实
2023年以来,AI大模型技术浪潮持续火热。一些高校院所和创新型企业加大研究力度,大模型技术不断迭代升级,包括百度、阿里巴巴等互联网公司以及复旦大学等科研机构,纷纷推出了自己的大模型。
公开资料显示,截至2023年10月份,国内已经发布了238个大模型,按类型可分为通用和行业垂直两类,通用大模型通过从海量数据中学习共性知识,成为具有通用性和泛化能力的模型底座。
“人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的核心基础能力,这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力,为通用人工智能带来曙光。”王海峰表示。
以文心一言为例,2023年3月,百度发布了文心一言大语言模型,用户使用场景非常广泛,从欢迎词、演讲稿到企划书、说明书,再到流程图、思维导图等,涵盖了工作和生活的诸多方面。
文心一言大语言模型是文心大模型系列中的一部分。百度自2019年起深耕预训练模型研发,发布了文心大模型1.0版本。文心一言的基础模型是文心大模型3.0。此后文心大模型快速升级到了3.5、4.0版本,理解、生成、逻辑和记忆四大AI基础能力全面提升。
王海峰介绍,文心大模型升级是基于在多个关键技术方向上进一步的创新突破,在知识增强、检索增强、对话增强的基础上进行了知识点增强、逻辑增强,以及增加插件和智能体机制等。
用大模型解决“刚需”
大模型研发门槛高、难度大,只有真正融入千行百业,解决产业发展的“刚需”,让产业从AI中收获价值,大模型才能实现可持续发展。
《北京市人工智能行业大模型创新应用白皮书(2023年)》提出,从模型演进看,通用大模型趋于收敛,垂直行业应用成为大模型产业落地的关键赛道。当前,大模型发展呈现出从技术到产品、再到商业化应用的发展路径,并不断深入垂直行业领域。
在深入垂直行业领域过程中,大模型依赖算法、算力和数据综合支撑,产业化面临挑战。王海峰表示,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。
目前,文心大模型已大规模应用于搜索、信息流、智能音箱等互联网产品,并通过飞桨开源开放平台、百度智能云赋能制造、能源、金融、通信、媒体、城市、教育等各行各业。随着应用场景的进一步扩大,文心大模型已与各行业头部企业、机构共建了超过10个行业大模型,助力企业降本增效,加快行业数智化转型升级。
在甘肃省临洮县,洮河穿越整个城区,每年都有溺水事件发生。2023年6月,临洮县水务局与百度智能云共同搭建的国内首个“人工智能防溺水应急救援体系”上线,科研人员通过AI视频分析测试数据、搭建防溺水模型,并用大量高质量场景化数据训练模型,能够对城区河道翻越栏杆、靠近水流、危险区域徘徊等危险行为第一时间识别和告警,为后续的应急处置、救援争取了宝贵时间。上线当月,防溺水系统第一个生命救援成功,至今已成功阻止多起高危行为。
百度还基于文心大模型对国家跳水队AI辅助训练系统进行了全面升级,系统不仅能理解和执行教练与运动员的复杂指令,及时提供准确信息,还可以对动作实时打分、精准量化分析。2023年,中国游泳协会授予百度“中国国家跳水队人工智能合作伙伴”称号。
文心大模型还应用于华人寻根中。通过与国家图书馆合作,文心大模型大量学习古代方志和家谱数据,并进行文字识别和理解,同时综合应用地点、职业、饮食、重要事迹等信息的知识图谱,在文心一言上线了“古文今问”服务。用户只需输入寻根信息,就能得到相应的线索反馈。
听障人士正在使用“声桥AI语训”练习说话 受访者供图
为AI原生应用提供全要素支撑
为推动大模型产生更多原生应用,近期百度围绕社区生态对星河社区进行了一系列新升级。
记者从百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜处了解到,全新发布的星河社区大模型工具中心,包括飞桨产业级模型库、百度大脑AI能力、文心一言工具等,同时支持生态工具接入,提供了可视化交互界面,参数配置灵活多样,预览效果实时呈现,为开发者提供了AI原生应用全要素,包括开发、体验、推广、交流一体化服务。
在生态共创方面,百度发布了文心大模型星河共创计划,将与开发者和生态伙伴共同激活数据资源价值,共建大模型插件,广泛创新AI应用。
此外,为加速AI人才培养,2020年百度提出“5年为全社会培养500万人工智能人才”的目标,目前培养的人才数量已完成目标的84%。大模型技术日新月异,对于AI人才也提出了更高要求,2023年百度发布了AI人才培养新举措——星河计划。
“我们将与产学研各界密切合作,深化产教融合,为社会再培养500万大模型人才。”王海峰表示,之所以这么做,是为了让AI科技的“创新之花”结出更多“产业之果”,服务国家战略、服务社会发展、服务人民福祉。■