当前位置：首页|资讯

Transformer架构的GPU并行和之前的NLP算法并行有什么不同？

作者：真忒修斯之船发布时间：2024-09-12

随着时间的推移，大型语言模型（LLM）开始崭露头角，这些模型拥有庞大的参数量，训练过程也变得漫长而复杂。为了有效应对这些挑战，使用多张GPU进行训练变得司空见惯，而并行计算技术也变得不可或缺...【查看原文】

推荐体验

相关资讯

大模型的应用征途重构与范式创新并行

方汉：我们发布的「天工」是拥有千亿参数的预训练大模型，它对标的是ChatGPT-3.5这样的底座模型，「天工」的应用范围也是面向全社会的。有了大模型之后，我们可以想象人人皆是创作者，这对于整个用户群的扩大是极…

昆仑万维集团 2023-04-28

谷歌推出TensorFlow数据并行技术

TensorFlow 可能是人工智能领域最著名和最广泛使用的开源机器学习平台之一。该平台原是由 Google 开发的，于 2015 年发布。TensorFlow 的魅力在于它的灵活性，可以用于许多不同的机器学习应用，从语音识别到图像识别，再到自然语言处理。这款工具集包括许多工具，如 TensorFlow.js、TensorFlow Lite 和 TensorFlow Extended，可以支持设备部署、机器学习的使用和大型数据集的管理。在 2023 年 4 月 28 日，谷歌宣布，在 Tenso

谷歌人工智能机器学习

晚器乃成 2023-04-28

新版Colossal-AI中AIGC和自动并行的硬件节约高达46倍

新版Colossal-AI中AIGC和自动并行的硬件节约高达46倍最近, 大规模人工智能模型获得了极大的关注和采用. AIGC一直很受欢迎.

AIGC 人工智能

bytebeats 2023-03-06

两种姿态并行：AIGC时代的银联商务

©️深响原创 · 作者｜吴鸿键多种趋势叠加下，我们再次迎来了一个潮水变向的时刻。经过数年的发展，产业数字化转型已经进入深水区、线上线下的融合程度也在加深。与此同时，以大模型、AIGC为代表的技术创

深响 2023-07-11

Transformer——ChatGPT背后的核心架构

Transformer——ChatGPT背后的核心架构什么是Transformer？Transformer是一种神经网络架构，它在自然语言处理（NLP）领域引起了革命。与先前按顺序处理输入数据（如逐字阅读）的模型不同，Transformer能够并行处理输入数据的各个部分。这种并行处理能力是游戏规则的改变者，因为它允许模型一次性地学习一个词与句子中所有其他词的上下文关系，而不是逐个学习。这意味着它能更像人类一样理解语言。Transformer的组成部分Transformer模型主要由两部分组成：编码器和解码

知识日新 2023-12-09

近期资讯

李飞飞创业融资16亿！团队首次官宣：1/3华人面孔，老黄和“乔布斯”都投了

我们是WorldLabs，一家空间智能公司，致力于构建大世界模型（LWM）来感知、生成3D世界并与之交互。Karpathy还来了一波回忆杀：正是他和李飞飞，以及WorldLabs另一位联合创始人JustinJohnson，一起创建了大受欢迎的人工智能课程cs231n的第一个版本。

量子位 2024-09-14

数字化转型加速，全国智慧酒店持续增长并力拓下沉市场

近年来，随着技术的飞速发展，许多传统行业面临前所未有的变革与挑战。酒店行业作为其中之一，正迎来智慧化、自动化的革命性转型，智慧酒店已成为市场中的新宠。根据中国旅游研究院发布的《全国智慧旅游发展报告2023》统计，截至2023年6月，中国智慧酒店市场规模已达1500亿元，同比增长18.5%。

福布斯 2024-09-14

电力、芯片制造、数据和延迟成四大限制因素，Scaling Law能续到2030年吗？

机器之心报道机器之心编辑部近年来，人工智能模型的能力显著提高。其中，计算资源的增长占了人工智能性能提升的很大一部分。规模化带来的持续且可预测的提升促使人工智能实验室积极扩大训练规模，训练计算以每年约4倍的速度增长。从这个角度来看，人工智能训练计算的增长速度甚至超过了近代史上一些最快的技术扩张。

机器之心Pro 2024-09-14

河南移动超200款数据服务上架郑州数据交易中心，首个河南运营商行业专区来了

员朱建浩张孟南王亚军】当前数据已跃然成为与土地、劳动力、资产、技术并列的关键生产要素，深刻影响着经济社会结构的重构。为积极响应并落实《河南省“数据要素×”行动实施方案（2024—2026年）》，河南迎来了数据要素市场发展的又一关键时刻，近日，河南首个运营商行业专区（移动数据专区）在郑州数据交易中心正式亮相。

大河财立方 2024-09-14

一年卖出 80 万台，AI 硬件开启猿辅导的「第二曲线」

在一年前正式推出学练机时，猿辅导还是这一赛道较晚的入局者。而洛图科技（RUNTO）统计，在2024第一季度中国学习平板线上市场中，猿辅导的学练机占销量榜首、销售额第二。

极客公园 2024-09-14

瞬间崩了！秒没，抢购一空！上万人涌入......

【导读】冲上热搜！9月13日晚8点，苹果全新发布的iPhone16系列手机开始预售。预售开始时，苹果官网一度无法进入购买渠道。“苹果官网崩了”“iPhone16ProMax秒没”等话题冲上微博热搜。据微博上的科技博主描述，昨晚iPhone16系列预售一开始，苹果官网崩溃。

中国基金报 2024-09-14

英媒：中国这方面“领先美国10到15年”

许多国家都在努力开发核能。中国也正在以远比其他国家更快的速度建造常规反应堆。能源领域咨询公司兰陶集团研究员大卫·费什曼说，中国的专长是有能力“建造原型、测试并修改，直到将效率提升到极限”。中国科学家正在比任何其他国家的同行申请更多的核聚变相关专利。

环球时报 2024-09-14

小鹏S5超快充站正式落地：1秒充电超1公里、峰值充电功率可达800kW

鞭牛士9月14日消息，小鹏日前宣布上海、天津、郑州、武汉四个城市正式落地新一代S5超快充站，1秒充电超过1公里。官方介绍，S5超快充站峰值充电功率可达800kW、充电速度1秒超过1公里、最大输出电流为800A，电压为1000V、插枪启动速度小于13秒。

鞭牛士 2024-09-14

苹果、华为“撞档”上新；壁仞科技启动上市辅导|科技一周

整理｜《财经》新媒体刘芬编辑|蒋诗舟【大公司动态】SpaceX完成全球首次商业太空行走北京时间9月12日晚，美国太空探索技术公司（SpaceX）载人“龙”飞船完成人类首次由非职业宇航员进行的商业太空行走任务。据媒体报道，随着“龙”飞船舱门打开，4名宇航员第一次同时暴露在真空之中，距地面高度700多公里。

《财经》新媒体 2024-09-14

逛海淀展区感受“AI+文化”魅力

在今年服贸会文旅服务专题展上，海淀展区以其独特的AI魅力吸引了众多目光，成为展会上的一大亮点。北京青年报记者在现场看到，占地200多平方米的海淀展区内，蕴含了丰富的“AI”元素，展现了海淀区在人工智能与文化产业融合创新方面的卓越成就。此外，AI卡通美颜换脸摄像和古装美颜换脸技术也让参观者体验到了穿越圆明园四十景的奇妙之旅。

北青网 2024-09-14

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1