↑ 点击上方 “亮哥圆桌派”关注我们
在快速发展的人工智能领域,生成式AI无疑是目前的大热点,也是引领了AI领域潮流的最重要一部分,无论是其大语言模型、多模态模型、具身智能,还是通用人工智能等技术,都在不断推动着智能科技的前进步伐。
亮哥今天来分享一下生成式AI的十大趋势,从数据的力量到数据中心的AI变革,从大模型在个人助理角色中的应用到对劳动力市场的深远影响,每个趋势都在为人工智能领域描绘着精彩的未来。
一、统一未来:多模态模型加速文本、图像和视频融合
多模态模型是指能够处理不同类型数据(如视觉、文本、听觉等)并将它们融合起来进行综合理解的人工智能模型。这种模型能够更全面地理解和处理真实世界中复杂多样的信息,从而进一步提升大型模型的迁移学习能力。多模态技术的发展在人工智能领域具有重要意义。
当前,单模态的人工智能模型,如处理文本、语音、图片等的模型,已经相对成熟。而大型模型正在向多模态信息融合的方向快速发展。一些重要的进展包括CLIP(Contrastive Language-Image Pretraining)模型的诞生以及GPT-4等模型的图像处理能力的提升。大型模型不仅限于文字和图像的处理,也开始拓展到音频、视频等领域。
未来展望方面,随着多模态技术的不断发展,模型将面临更加复杂多样化的交互场景。多模态技术将在智能家居、智慧城市、医疗诊断、自动驾驶等领域打开全新的应用空间,进一步推动人工智能的发展。
二、逾越虚拟边界:具身智能成为AI发展新形态
具身智能是指那些可以感知和与物理世界进行交互,具有自主决策和行动能力的人工智能系统。这些智能体能够以主人公的视角感受物理世界,并通过与环境的交互结合自我学习来理解和改变客观世界。
近年来,具身智能被认为是计算机视觉领域的重要发展方向,被形容为人工智能研究的"北极星"。一些企业和研究机构推出了具身智能相关的产品和项目,如谷歌的RoboCat大模型和英伟达的Nvidia VIMA。
未来展望方面,通用人工智能和机器人产业正处在快速发展、相互融合促进的战略机遇期。具身智能作为两大领域交叉的核心应用,有望在未来取得快速发展。它将推动智能体具备更多自主规划、决策、行动和执行的能力,实现人工智能的进一步进阶。
三、大模型智慧火花:走向通用人工智能的途径愈发明晰,脑机接口创造新的交互方式
另一方面,人类与人工智能之间的交互方式也在不断升级,脑机接口有望成为下一代人机交互方式。当前,脑机接口技术正在突破人类的生理界限,不仅为残障人士提供了前所未有的可能性,还有望成为下一代的人机交互方式。
四、数据的力量:海量数据带来模型能力涌现,高质量数据提升模型性能
深度学习的进步建立在更大模型处理海量数据的基础上。从GPT-1模型的1.17亿参数到GPT-3的1750亿参数,模型的效果取得了显著突破,并涌现出新的能力。然而,模型参数量的增加也带来了算力需求的激增,模型架构和参数量提升带来的收益正逐渐减少。
据阿伯丁大学、麻省理工大学等研究机构的报告,高质量的语言数据预计在2026年将耗尽,而低质量的语言数据和图像数据将分别在2030-2050年、2030-2060年间枯竭。
以数据为中心的人工智能更加专注于数据的价值,进一步推动AI模型的性能突破。斯坦福大学的吴恩达教授提出了二八定律:80%的数据+20%的模型=更好的AI。数据中心的策略可以解决数据样本不足、数据偏差等问题,高质量数据集成为推动模型性能进一步提升的关键要素,高质量的数据处理、数据标注服务以及完善的数据收集和评估体系的价值将进一步凸显。
五、数据中心的AI变革:智算中心成为关键基础设施
云计算是当前重要的AI算力提供方案,AI服务器市场获得迅猛发展。根据TrendForce数据,2022年全球AI服务器的出货量约占整体服务器比重的1%,随着大型模型训练和推理的需求爆发,AI算力资源需求预计将呈指数增长。根据IDC的数据,未来5年中国智能算力规模的年复合增长率将达到52.3%,全球价值万亿美元的数据中心存量市场将从通用计算逐步过渡到AI计算。
云计算正从以CPU为中心的同构计算架构向以CPU+GPU/NPU为中心的异构计算架构深度演进。预计,大型模型带来的GPU存量空间将从2023年的277亿美元上升至2025年的1121亿美元,以GPU为代表的AI计算资源在短期内将供不应求。
随着专有领域计算需求的提升,AI芯片追求更高的性能和更低的功耗,芯片的多样性和生态丰富性将不断提升。一些头部互联网厂商将着力推进AI芯片的自主研发,例如谷歌致力于打造专注于深度学习的TPU,并不断丰富其AI生态布局。
六、大模型C端角色:个人智能助理与新一代的流量入口
大型语言模型将成为个人智能助理的关键。目前,大型模型已具备接入互联网、进行内存管理等能力,通过目标任务自动拆分、计划制定和计划实施等方式,能够自主完成用户的需求,成为每个人的智能助理,例如制定旅行计划并预定住宿和餐饮。
大型模型也将成为新一代的流量入口。GPT-4正逐步开放插件功能,通过底层模型连接第三方应用,构建丰富的生态系统。自插件功能开放以来,GPT-4已接入超过500个插件,包括教育、金融等领域。随着大型模型能力的增强和插件生态的丰富,大型模型有望成为新一代的人机交互方式和流量入口。根据2023年5月的数据,OpenAI官网访问量为18.6亿次,是全球第19名次的互联网访问IP。
七、大模型B端应用:专业数据与成本驱动行业模型百花齐放,打开广阔应用空间
数据壁垒带来企业端大型模型百花齐放。通用大型模型可以帮助用户解决一般性问题,但当企业需要处理特定行业的数据和任务时,往往需要对基本模型进行垂直领域的微调。不同垂直行业具有不同特性和需求,因此大型模型的应用呈现多样化趋势。
B端应用出于对模型经济性的考量,未来将呈现阶梯式、差异性需求。大型模型在垂直领域的商业化落地对模型的运行成本更为敏感,需要不同参数规模的大型模型组成多层次的产品组合,从而在不同场景下实现最佳的经济性,进一步提升大型模型的丰富度。
八、大模型轻量化:降低应用成本、带动端侧算力发展
随着大型模型小型化和场景化需求的增加,同时出于对AI应用的经济性、可靠性和安全性的考虑,部分场景的推理将逐步从云端扩展到端侧,带动端侧算力需求的进一步提升。
目前,多个大型模型都已推出“小型化”和“场景化”版本。例如,谷歌于5月23日发布的PaLM-2大模型中,最轻量版本“壁虎”可在移动端运行,运行速度快且支持离线操作。其他大型模型也有对应的小参数版本。
大型模型端侧应用布局不断加速。端侧算力正在快速发展中,高通通过量化、编译和硬件加速进行优化,使Stable Diffusion能在搭载第二代骁龙8移动平台的手机上运行。高通在微软Build2023开发者大会上展示了最新的端侧AI能力以及在下一代Windows 11上开发生成式AI的工具,并表示未来几个月大型语言模型有望在端侧运行。
九、大模型的深远影响:重构劳动力市场、改写科研范式
大语言模型对劳动力市场结构产生了深远而复杂的影响。根据OpenAI联合宾夕法尼亚大学的研究报告预测,约80%的美国劳动力可能有至少10%的工作受到大语言模型的影响。
大语言模型的应用带来了劳动力市场结构的调整和变化。短期内,大语言模型可能替代部分低技能或重复性工作。中期来看,大语言模型也将创造新的与人工智能相关的就业机会。长期来看,大语言模型的应用将深刻改变各行业的工作模式和商业模式,让企业的组织架构更加扁平化和小型化。在这个过程中,需要个人和企业积极适应,发展人类独有的创新、协作和社交等能力,与人工智能共同进化。
此外,AI与前沿科学的结合展现出巨大潜力,可显著降低前沿科技研究中的智力成本并提升研究效率。生命科学、气象预测、数学、分子动力学等前沿科学领域均得到了人工智能的广泛助力,AI for Science将带来科研范式的变革和新的产业形态。
十、AI治理与技术的平衡:AI可解释性亟待增强,监管紧迫性日益凸显
在人工智能的快速发展中,加强AI监管与推动AI技术进步同等重要。人工智能的能力带来了应用的便利性,但同时也可能引发数据隐私、算法偏见、AI伦理等一系列问题。
从技术角度来看,可以通过可解释AI等技术手段增强AI的可信度。可解释AI使人工智能的决策过程透明化,增加输出内容的可理解性和可信任度,对于构建用户对AI系统的信任、提升系统的有效性以及应对潜在的伦理问题都至关重要。
从规范角度来看,各国政府已经开始采取行动,制定和执行各种AI政策和法规。在4月份,我国网信办出台《生成式人工智能服务管理办法(征求意见稿)》,明确了生成式人工智能的定义,为行业划定底线从明确条件要求、划定责任主体、形成问题处理机制、明晰法律责任等方面进行规范。
扫一扫关注亮哥圆桌派
分享更多你需要的知识!
来到圆桌派
我们一起旁观者清