1956年人工智能的概念被首次提出,直到去年ChatGPT出现,各行各业大谈大模型,人工智能才更广泛地在各种层面的应用中出现在人们的生活里。一方面人工智能重塑各行各业,另一方面也带来了隐私保护、储存安全等问题。
10月25日,由澎湃新闻和上海漕河泾新兴技术开发区联合主办,上海人工智能研究院学术支持的科创先锋论坛以“大模型与数字治理”为主题在漕河泾会议中心成功召开。在圆桌沙龙环节,围绕“AI大模型的产业应用与数字安全”这一话题,澎湃新闻内容风控首席运营官孙光海与上海市计算机软件评测重点实验室副主任,研究员陈敏刚、蚂蚁财富保险事业群首席技术架构师曹刚以及智己汽车副CTO郭辉展开了精彩对话,分享了大模型在城市治理、金融、自动驾驶以及传媒领域的应用。
左起:澎湃新闻内容风控首席运营官孙光海、上海市计算机软件评测重点实验室副主任,研究员陈敏刚、蚂蚁财富保险事业群首席技术架构师曹刚、智己汽车副CTO郭辉
以下为对话实录,略有删减:
大模型何为“大”?
上海市计算机软件评测重点实验室副主任,研究员 陈敏刚
陈敏刚:大模型的大主要表现是模型参数规模非常大。在学术界有个规律,当模型参数量达一定规模会出现“智能的涌现”,也就是说只有参数规模足够大,才会执行复杂的推理。此外,训练数据量很大。据了解,维基百科的语料只占到ChatGPT训练语料的约3%。最后,需要用到的算力非常大。据OpenAI的声称,GPT-3的一次训练,单次大约需要450万美元。
但是我觉得最本质的是应用范围很大。大模型拥有很好的泛化能力。以前人工智能都是弱人工智能或者是窄人工智能,一个应用就需要开发一个模型。但是在大模型时代,人类可以通过一些提示工程(Prompt)快速地去泛化到下游的各类任务,一站式地解决各类任务。所以我觉得大模型为未来产业可能带来最大的变革,就在于它这种对于各种场景的泛化和适配的能力。
蚂蚁财富保险事业群首席技术架构师 曹刚
曹刚:我理解大模型的“大”是,对人工智能产业技术的影响非常大。类似像ChatGPT这样一个“杀手级”应用,基本上花2个多月时间就可以做到1亿的MAU(月活跃用户数量)。而国内,以大家用得最多的抖音为例,差不多要花9个月的时间。
蚂蚁集团今年也制定了集团的三大战略,其中之一是AI-First。我们不能把AI技术仅仅视作拓覆盖、提效率的锦上添花的能力,而是用AI-First这种理念指导业务的生产,重塑整个业务的链条,推进业务走向下一个阶段。
大模型在不同行业正在解决什么问题?
陈敏刚:首先谈到城市治理这个话题,前几年非常火的一个概念叫做“智慧城市”,有些地方也称为“城市大脑”。城市大脑、智慧城市的目标就是要实现城市的数字化转型,提升城市治理的体系和治理的现代化。因为这一段时间ChatGPT实在太火,好像把智慧城市、城市大脑的声音给淹没了。在我看来大模型是可以对现有的城市大脑做一次升级,下面我举几个例子。
首先,政务大模型。比如说像政务咨询,如果有了大模型,我们可以更加准确地去理解用户办事要求,甚至可以引导用户说出他真正想要办的业务。
另外城市大脑有一个很重要的应用,是要用AI感知城市发生各种的事件,快速做处置和处理。以前在大模型没有出现之前,可能每一个具体的视觉场景,比如占道经营,就需要一个视觉的模型去发现这些不合适的场景。未来我们有了多模态大模型以后,是否有机会让一个大模型去解决掉我们城市感知的各个问题?用一个大模型可能就可以解决掉违法占道、违法停车、交通违法、道路积水等所有长尾的场景。
第三,OpenAI近期提供了一个很强大的插件,原来叫代码解释器,现在更新成Advanced-Data-Analysis插件,可以快速自动化地、用人机交互的方式去做数据分析。有这样的工具后,我们在城市治理的场景下,可以快速对城市发生的各种采集数据进行精准、快速、高效的处理,然后来辅助我们政府的决策。
曹刚:蚂蚁集团一直都深耕在金融领域。就现在而言,我们理财和保险领域核心是把大模型用在两个方面:第一个,用户体验的提升;第二个,提效业务生产链路。
首先讲讲用户体验的提升。我们之前发布了支小宝的2.0,是一个个人理财助理,同时也是保险助理,你在上面可以通过问答的方式问一些关于理财保险的知识。通过大模型的技术进行产品升级,整个问答端的准确率可以得到大幅提升,目前能够达到95%以上。
在生产力提升方面,我们发布了支小助1.0,这是一个针对金融从业者的业务专家助手,类似于微软的Copilot。在金融领域,我们的服务链条非常纵深,涉及许多业务专家。我们使用大模型的技术来重塑传统工作流程,让支小助成为一个大模型驱动的产品,从而显著提高整个业务专家和金融从业者的效率。
举例来说,我们为理财师的顾问团队和保险代理人团队提供了一个支小助的服务版,通过大模型的加持,我们的团队管理范围的服务人数提升了70%以上。另外,在营销领域,我们使用大模型技术生产文案、图片和视频等创意,让有限的产品上叠加无限的创意,从而显著提升业务转化效果。在保险领域的理赔问题上,我们通过大模型的技术实现了图像信息提取和推理技术的联合,形成了全自动化的能力,大大缩短了用户理赔的时间。
智己汽车副CTO 郭辉
郭辉:我分享一下在汽车领域大模型应用的状态。大模型会大大提升我们在自动驾驶领域里面人工智能模型的迭代速度。首先大模型在云端有非常丰富的参数,能够帮助我们进行相应的仿真测试,在有足够丰富数据输入前提下,我们可以使用大模型训练小模型,部署在车端,大大提升我们在车端运行小模型的迭代效率。其次是大家熟悉的智舱。在与人类的交互过程当中,我们在车上更多是使用语音的交互功能,怎么样更好识别人的意图,能够给人提供准确的内容,这是我们在落地实现的。
澎湃新闻内容风控首席运营官 孙光海
孙光海:澎湃新闻在内部也进行了AI绘画、AI写作、AI审核三方面的探讨。尤其是我在跟其他新闻网站同行交流,我说澎湃新闻每天发布400多条的原创稿件,每篇稿件都要配插图、配图。如果AI技术发展到一定程度,可以通过AI生成图片来节省相关的运营成本,减轻美编的工作负担。
在AI协作方面,我们在智能跟评方面也在做内部的测试,更为成熟的一点是内容安全这方面。比方说现在大家看到APP有些突然下架了,访问有一个栏目突然停更了,这些情况十有八九是内容合规方面导致的。澎湃新闻开发了澎湃清穹服务,正式对外为党政、媒体、国有企业、资讯平台服务,目前的效果还是不错的,尤其是在社政领域。
具体到场景,大模型如何提升?
曹刚:通用大模型在金融领域要落地是一个非常复杂的系统工程,起码要解决三个挑战。
首先,通用大模型对金融领域的认知有短板。比如,我能不能买到一个保本保息高收益的产品?实际上在市场上这种产品基本上不存在,因为这都是有严格的金融监管以及金融的体系来维护的,所以我们需要对它进行专业的金融通识相关的训练,甚至我们自己场景对于金融业务的理解也需要让它训练起来,灌入到它整个知识结构当中。
第二个挑战,在金融领域其实有很多推理和决策的内容,最简单的:你到底要不要买这个股票?这涉及大的推理过程和决策过程,这是目前我们看到通用大模型很难直接给出答案的。
第三,整个金融因为是非常严谨的,具有很强的量化数字的属性,我们知道往往通用大模型比较擅长文科相关的工作,对于数字计算、复杂的量化计算这部分能力还是比较欠缺的。加上金融领域合规性要求非常高,一个投资者过来到底能买什么产品,不能买什么产品,起码得遵守合格投资者的管理办法才能把合格的产品推荐给他,这些通用大模型基本上很难做到。
郭辉:汽车领域来看,我们解决两类问题,一类是成本和效率的问题,就是在云端的大模型,包括它的训练,以及最终部署到服务器,甚至我们把它进行裁剪,最后放到车端整个代价是什么?
第二是解决时延的问题,哪怕今天的网络条件,也总有连不上网的时候。连不上网怎么满足智能驾驶安全方面的需求?大模型+小模型并行的方式,我们在探索这个方向。
数据安全如何保障?
曹刚:国家层面其实已经看到这样的问题,此前出台的《生成式人工智能管理办法》一定程度上就是为了规避这些问题。就蚂蚁集团而言,我们是一家科技公司,底层积累了非常多的数据,个人安全和隐私保护,我们集团层面一直非常重视这个问题。所以从数据的采集、加工、传输、存储,集团有专门的部门进行管理,有相应的数据分级分类以及一些各类管理机制以及规范。
陈敏刚:数据泄露是一个重要问题,大模型存在Prompt攻击的漏洞,攻击者可以通过输入特定提示绕过安全机制引导大模型说出有害内容。
此外,大模型应用中存在幻觉问题,即输出的信息在语义、语法上可能是正确的,但具有误导性、错误性或矛盾性。我们团队的测试结果显示,ChatGPT4在幻觉输出概率上达到30%,国内大模型这一数据超过50%。这样一些现象,就提醒我们在大模型真正应用落地的时候要注意非常的小心。
郭辉:汽车行业两大类的安全,一类我们叫功能安全,另外一类叫信息安全。在功能安全方面,汽车厂商需要确保硬件、软件和模型的冗余设计,以防止单点失效导致人身安全的威胁。而对于人工智能模型的安全性保证,需要建立一个可解释的、规则明确的安全框架来兜底。此外,在开发流程中还需要进行针对人工智能的对抗性训练,包括对抗样本生成等,以增强模型的鲁棒性和安全性。
而在信息安全方面,汽车行业需要从设计系统本身的防护能力、整体的安全架构以及失效后的检测和防护机制等方面进行考虑,以保障网络和数据的安全。此外,还需要进行利民攻击测试以及隐私安全保护,包括最小化数据采集和确保数据安全合规的要求。
算力的提升对不同场景有何影响?
曹刚:国家在基础算力方面布局是非常好的事情。首先,基础算力基础设施的布局有助于解决技术卡脖子的问题。蚂蚁金融大模型底座是跑在万卡的异构集群上面的。实际上万卡里面绝大部分的GPU卡资源都是采购于英伟达,只有少部分是采购国产的GPU资源。所以公共算力资源的布局,有利于让更多的企业能够进来,降低了准入门槛。整个产业活跃度起来后,真正受益的应该是终端消费者。只有这样,我们有很多的想法才能满足。
郭辉:我补充另外一个经济性维度。第一,国产化相应大算力的芯片有助于良性的市场竞争,使得最后我们消费者能够享受到普惠。第二,我们从行业的应用来看,不同公司波峰和波谷一定存在不均匀的情况,如果可以消除波峰波谷,就像电力一样,我相信各个行业都能够获益。
陈敏刚:算力提升会加速通用大模型商业化的应用。其次,会加速我们垂直领域大模型的研究和应用的落地和大模型深度应用。什么叫深度应用?前面我也提到了OpenAI开放了很多的插件,这些插件可以帮助你快速去交互式分析大规模的数据,这就是深度应用。深度应用肯定需要用到大量的算力。同时,未来如果算力足够,大模型和我们具身智能相结合,可能会推动像人形机器人非常前沿技术的快速应用和落地。
孙光海:我们有一种说法,人工智能1.0如果说是相当于发明了电,那人工智能3.0在AIGC大模型这样的情况下相当于一张电网。从短期来看AIGC改变了基础生产力的一个工具,有些说中期来看改变了社会生产关系,长远来看改变了社会生产力。我们也希望AI+时代会有更惊艳的商业创新和商业模式,助力我们的生活更加美好。