当前位置：首页|资讯

杨强：大模型训练可用的公域数据将耗尽 2028年是关键之年

作者：新京报发布时间：2024-12-22

新京报贝壳财经讯（记者姜樊）“当前，可用于预训练大模型的公开数据几乎已经用尽了。人类生成数据的速度远远没有机器能够消化这些数据的速度快。”12月22日，香港科技大学荣休教授，加拿大皇家学院院士、加拿大工程院院士杨强在中国财富管理50人论坛2024年会“AI浪潮下的金融业应变”主题论坛上表示，预训练将会终结，新的方向还在探索。

杨强预测，2028年将是关键之年。他展示的数据库存规模与数据消耗规模的曲线图显示，两条曲线将于2028年相交。这意味着2028年可用于大模型训练的公域数据将用尽。

当公域数据用尽之后，还未用于大模型训练的私域数据则面临隐私安全问题。

“人类在使用大模型的时候，会暴露隐私，尤其是在金融业。”杨强指出，在大模型使用过程中，需要用到企业的内部数据，隐私保护成了大模型应用中的关键问题。

杨强指出，金融界有很多需求，机构的数据远远不够，需要把不同机构的数据合并起来。但是合并的时候，又有这样的顾虑，就是隐私安全。

事实上，科学界对大模型发展路径已有探讨。杨强总结道，一是大模型创造的智能体，要建立大量的垂域专家，做到能学习、沟通。二是该智能体要能推理，根据已经学的知识思考未来。三是该智能体有理解能力、有同理心，能理解人类。四是该智能体应该产生自我意识。

“智能体第一个重要能力是推理和组合，能够使用资源。第二个重要能力是人造数据的产生。”杨强进一步指出，所谓人造数据是指智能机器人等创造出来的数据。人们通过模拟器去训练模型之后，模型再适配到现实的场景产生数据。这样所产生的数据，对机构的训练模型同样非常有用。

此外，杨强指出，如何让大模型落地到私域的机构，在本地建立小模型，能够通过各种新的人工智能技术，包括这里所说的联邦学习和迁移学习，把大型通用能力赋予到小模型，能够让小模型的专业能力教会大模型是当前需要做的事情。这需要强化大模型的迁移学习能力和联邦学习能力。有了这些能力，叠加模拟和生成数据的能力，就可以训练具有智能的机器人。

校对刘军

推荐体验

相关资讯

ChatGPT等模型：到2026年，将消耗尽高质量训练数据

此外，随着ChatGPT、Midjourney、Gen-2等模型生成的AI内容进入公共网络，这对人类构建的公共数据池将产生严重污染，会出现同质化、逻辑单一等特征，加速高质量数据消耗的进程。为了研究训练数据消耗…

ChatGPT Midjourney

巴比特资讯 2023-11-28

大模型训练将耗尽人类语言？AIGC暴露潜在瓶颈合成数据成“救星”

《科创板日报》3月8日讯（编辑宋子乔）中国证监会科技监管局局长姚前日前在《中国金融》杂志撰文称，建议重点发展基于AIGC技术的合成数据产业。以更高效率、更低成本、更高质量为数据要素市场“增量扩容”，助力打造面向人工智能未来发展的数据优势。那么，究竟什么是合成数据？它又为什么可以为数据要素市场“增量扩容”...

AIGC 金融证监会人工智能

科创板日报 2023-03-08

破解大模型训练数据瓶颈，云测数据提供关键支撑

随着大模型技术的突破,新一轮人工智能浪潮正在引领各行各业快速发展,加速推进着人工智能实用化、通用化和普惠化发展进程。数据作为此轮变革的主要驱动力,已成为人工智能发展的关键战略要素。值得注意的是,AI的突破将得益于高质量数据,这是大模型性能提升、行业应用落地的关键。

砍柴网 2024-01-21

超级文生视频模型Sora正式来了！多模态训练数据是关键

OpenAI圣诞季“十二连发”的第三个工作日，迎来了重头戏——万众期待的OpenAI视频生成模型Sora正式版发布！今年2月，Sora首次问世便以其卓越的表现震撼了科技届。整体来说，Sora展示的一系列功能，在视频生成的质量、功能的独创性、技术的复杂度等方面，超出了目前市场上已有的文生视频产品。

砍柴网 2024-12-17

ChatGPT遇强则强，学会提问是关键

举个例子，如果我们现在让ChatGPT写一篇文章，我们可以先来个自我介绍，告诉对方你是谁。我们在问题里对ChatGPT说，我是一个专栏作者，平时会写一些关于个人成长的深度话题文章，我现在要撰写一篇文章，主题是…

AI侠客宋学东 2023-05-26

近期资讯

对标奥迪Q7不客气全新星纪元ET增程四驱23.98万元起售

12月15日，奇瑞高端品牌EXEED星途星纪元之夜上，全新星纪元ET增程四驱正式上市，此次新车推出增程四驱Max、增程四驱Ultra、增程四驱Premium三款配置，官方指导价23.98万元-28.98万元。官方置换补贴2万元，补贴后价格21.98万-26.98万。同时官方送上了升级8295P芯片、20英寸刀锋轮毂在内的5项回馈老车主的权益。 [图片] [图片] 发布会上，奇瑞控股集团党委书记、董事长尹同跃强调：“星途星纪元要打造成为名副其实的科技新豪华品牌，成为代表中国汽车的全球名片，代表中国豪华品牌

大志聊车 2024-12-16

智电新程与美好同行吉利银河E5对比试驾品鉴会in西安

【陕西汽车在线讯】高能集结，驾趣进阶段，在新能源汽车的璀璨星空中，吉利银河 E5 宛如一颗耀眼新星强势登场。上市119天，交付达成60000+台。近日，“智电新程，与美好同行”吉利银河 E5 试驾品鉴会于西安盛大启幕，活动在风景秀丽、位于关中环线且有着独特自然风光的雁引驿举行，众多媒体大咖与汽车爱好者纷至沓来，共同领略吉利银河 E5 这款全球智享纯电 SUV 的非凡魅力。吉利银河E5作为吉利基于最强智能新能源体系力，为全球“进阶生活新E代”群体打造的“六边形战士“，拥有安全标准同级第一，空间体验同级第一

陕西汽车在线 2024-12-16

【喷雾降尘系统】-山东艾蓝设计-价格

【喷雾降尘系统，实际现场效果】每一个图片均为实际施工现场拍摄，支持现场考察，眼见才能为实，降尘决定一切，让客户超出预期智能喷雾降尘系统采用PLC控制，主泵配有变频器实现泵的软启动和水压恒定设置。且喷雾降尘在主机中集成多组传感器实时采集水压、水位、粉尘浓度、温度等数据，根据实时的数据对机器运行状态进行调整使得喷雾压力的恒定，使得喷雾头的雾化效果达到理想效果。喷雾降尘主机自带微米级过滤，具有自动补水和缺水停机保护功能。喷雾降尘主机带有吹扫功能可以很好的解决冬季结冰难题。型号：ALDLP-5Z、ALDLP-

山东艾蓝环保 2024-12-16

蛙皮素 1：Magainin 1 (108433-99-4）

Magainin 1 (Magainin I) 是从 Xenopus laevis 皮肤中分离出的一种抗菌和两亲性肽。Magainin 1 对多种革兰氏阴性和革兰氏阳性细菌均表现出抗生素活性。 [图片] 英文名称：Magainin 1 (Magainin I) 中文名称：蛙皮素 1 CAS号：108433-99-4 分子式：C112H177N29O28S 分子量：2409.85 纯度：≥95% or 98% 货期：现货性状：白色固体粉末储存条件：-20℃ 序列：Gly-Ile-Gly-Lys-Phe-

正肽生化 2024-12-16

粉碎格栅机的介绍

[图片] 粉碎格栅机产品介绍采用单鼓结构，功能性，持久性，维修费用和安装的简易性*。它是由一个转鼓栅网和合金钢切割刀片粉碎器组成，能在高流量下，把难以处理的固体颗粒粉碎成可处理的小颗粒。新的不锈钢无轴转鼓提高捕获效率，增加了流量，防止物体缠绕并且更加牢固。转鼓式粉碎型格栅的*设计提高了固体的捕获率，更好保护下游设备，使长期的维修费用降为较低。粉碎型格栅一般为整体设备，安装时一般只需进行吊装及电气接线。安装后，须检查设备底部是否有渠道底紧密结合，无倾斜；设备两侧是否与导轨结合牢固，无晃动。而且须注意设

南京新秀环保设备 2024-12-14

搬运设备更新慢，标准怎样促进发展？

在快速变化的工业与物流领域，搬运设备作为生产效率与作业安全的关键因素，其性能与效率直接关系到企业的运营成本和市场竞争力。然而，现实中搬运设备的更新速度往往滞后于技术发展的步伐，这不仅限制了生产效率的提升，还可能引发安全隐患。面对这一挑战，团体标准作为一种行业自律与协作的机制，正逐渐成为推动搬运设备更新与发展的有力工具。本文将探讨搬运设备更新慢的原因，分析团体标准在促进搬运设备更新与发展中的作用，并提出实施策略。一、搬运设备更新慢的原因分析1. 资金投入限制：中小企业往往面临资金紧张的问题，难以

国联政研 2024-12-16

『碳案局』| 12MW分布式光伏电站，看科盛0帧起手，强势支撑绿电

随着可持续发展理念的深入人心，越来越多的行业更加注重使用可回收材料和减少对环境的影响。本期碳案局，让我们一起深入了解新材料行业中的合成纸企业案例，看新能源与新材料强强联手，共同迈向更可持续的发展道路。点击观看视频新能源+新材料 BUFF叠满利昌新材料总部位于福建省泉州市，专业生产PP合成纸和BOPP透明薄膜，以不断创新、可靠、卓越和可持续为目标，致力于提供高性价比的产品和细致的售后服务。由科盛与利昌联合打造的12MW分布式光伏电站已经完工并网，正在源源不断的为企业提供清洁电力。项目采用光伏系统一

科盛光伏 2024-12-16

etc可以在停车场用吗？(任货行ETC靠谱)

在城市生活中，停车是一件既常见又烦人的事情。随着城市人口和车辆数目的与日俱增，寻找停车位和排队缴纳停车费的问题也愈加突出。而随着科技的发展，电子不停车收费系统（ETC）作为一种全新的支付方式，正在为车主们带来更为便捷的停车体验。什么是ETC？ETC是电子不停车收费系统的缩写，最初用于高速公路和桥梁的通行费收取。其基本原理是，车辆上安装一个ETC车载设备（OBU），当车辆经过收费站时，该设备会和道路上的天线进行无线通信，自动识别车牌信息并从车主的银行账户中扣除相应费用。这种方式不仅缩短了车辆等待时间，减少

粉红豹178 2024-12-16

利西拉肽：Lixisenatide（320367-13-3）

Lixisenatide 是一种胰高血糖素样肽-1 受体 (GLP-1 receptor ) 激动剂。Lixisenatide 通过下调促炎细胞因子、阻断细胞信号通路抑制炎症反应。Lixisenatide 通过将巨噬细胞重编程为 M2 表型，减轻炎症，从而减少 Apoe−/− Irs2+/− 小鼠的粥样斑块大小和不稳定性。 [图片] 英文名称：Lixisenatide 中文名称：利西拉肽 CAS号：320367-13-3 分子式：C215H347N61O65S 分子量：4858.49 纯度：≥95% or

媛子dayup 2024-12-16

煤矿车辆自动灭火系统/装置—真正做到矿车火灾灭小、灭早、灭初期

煤矿车辆作为煤矿及非煤矿山企业生产过程中必不可少的辅助开采与运输设备，可有效解决矿山开采作业与转运作业工作量大和效率低的问题。因此，其投入应用量大，应用频率高。但是当煤矿车辆长时间持续作业时，作为矿车主要动力源的发动机舱，很容易出现温度过高的现象，一旦与积聚的粉尘及油污接触，很容易引起车辆火灾的发生。因此，为了保障众多煤矿车辆的消防安全，给车辆发动机舱等易燃空间配备防治一体化的自动型消防灭火装置成为各煤矿与非煤矿企业的主要选择。 [图片] 煤矿车辆自动灭火系统/装置是以德国地下矿业消防技术为核心的智慧型防

普泰法尔车辆自动灭火 2024-12-16

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1