当前位置:首页|资讯|英伟达|微软|AI芯片|生成式AI

AI行业报告:英伟达推出AI芯片H200,微软发布首款自研芯片(附下载)

作者:超爱跑步发布时间:2023-11-27

原标题:AI行业报告:英伟达推出AI芯片H200,微软发布首款自研芯片(附下载)

今天分享的是AI系列深度研究报告:《AI行业报告:英伟达推出AI芯片H200,微软发布首款自研芯片》。

(报告出品方:西部证券)

报告共计:12页

海量/完整电子版/报告下载方式:公众号《人工智能学派》

一、AI行业重点事件点评

1.1 英伟达推出AI芯片H200,芯片选代显著提速

事件: 英伟达在 2023 年全球超算大会 (SC2023) 发布了AI 芯片H200,该款新的 GPU基于H100 进行了升级,预期 2024 年二季度发货。

点评:

亮点 1: H200 是目前首款提供 HBM3e 的 GPU,内存更快、更大。HBM3e 可加速生成式 AI 和大型语言模型,同时能推进 HPC 工作负载的科学计算。借助 HBM3e,NVIDIAH200 能以每秒 4.8 TB 的速度提供 141GB 内存容量,与NVIDIA A100 相比,容量几乎翻倍,带宽增加 2.4 倍: 相较于H100,内存容量接近翻倍,内存带宽增加 1.4 倍,推理性能最高提升近两倍,整体能耗和成本也大幅降低。

亮点2:大模型推理加速,效率显著提升。H200 更大更快的内存可加速生成式 AI 和 LLM的运行,同时以更高的能源效率和更低的成本推进 HPC 工作负载的科学计算。运行GPT-3 等模型时,NVIDIAH200 Tensor Core GPU 的推理性能提高了 18 倍。不仅如此在其他生成式 AI 基准测试中,还能在 Llama2-13B 上每秒可处理 12000 个 tokens。

亮点3: 教据传输提速,减少运行应用程序的处理步骤。内存带宽对于 HPC 应用程序至关重要,因为它可以实现更快的数据传输,减少复杂的处理步骤。对于那些内存密集型HPC(高性能计算) 应用如模拟仿真、人工智能研究等,H200 更高的内存带宽可确保高效地访问和操作数据,与 CPU 相比,给出结果的时间最多可加快 110 倍。

亮点4: H200与H100 完全兼容,无需更改服务器系统即可升级。由于框架未发生改变,H200与H100 有着完全的兼容性。这意味着已经使用先前模型进行训练的 AI 公司将无须更改其服务器系统或软件即可使用新版本,免去服务器或软件更换带来的菜单成本。

我们认为,H200 芯片意味着算力基础设施加速升级是主旋律,美国出口管制新规背景下建议持续关注国产 A1算力产业链的投资机会。H200 的发布进展意味着英伟达芯片的开发迭代周期大幅缩短,A1基础设施加速升级为 AI应用生态的发展奠定了基础。AI芯片端的创新和升级也将带动产业链配套环节的加速演进和升级。

投资建议: 英伟达 AI 芯片的创新升级是产业发展的风向标,建议关注其创新对国产 AI算力链的催化,关注 1、国产 HBM 产业链及相关配环节;2、英伟达的国产供应链环节光模块环节关注天乎通信、中际旭创、新易盛;PCB 环节关注沪电股份、胜宏科技等;3、国产 AI 芯片映射关注寒武纪、龙芯中科等。

1.2 微软Ignite 2023技术大会: AI转型,技术驱动变革

事件: 据微软官网,在当地时间周三(11 月 15 日)举行的 Microsoftlgnite 全球技术大会上,微软发布自研人工智能芯片 Microsoft Azure Maia,以及英特尔 CPU 的竞品: 基于Arm 架构的云原生芯片 Microsoft Azure Cobalt,并对微软 Copilot 系列产品进行了新发布和更新。

点评:

[基础设施端]亮点1: 微软首款 A芯片 Maia100 专门用于云端训练与推理。Maia 100是微软为微软云中大语言模型训练和推理而设计的首款 AI 芯片,采用台积电 5nm 工艺晶体管数量达到 1050 亿个,因此,当涉及到晶体管或时钟速度时,它并不属于轻量级。同时,针对 AI 和生成式 AI 进行了优化,支持微软首次实现的低于8 位数据类型 (MX数据类型),用于 OpenAl模型、Bing、GitHub Copilot 和 ChatGPT 等 Al 工作负载运行云端训练和推理。微软表示,目前该款芯片仅为微软自己的 AI 应用程序提供支持,之后再向客户和合作伙伴开放。

除微软外,其他科技巨头也布局自研 AI 芯片,并通过与 A 初创公司合作率先绑定用户:

1) 谷歌 TPU 从 17 年具备训练和推理能力,目前迭代至 TPUv5e。Midjourney 将采用谷歌 TPU 训练其第四代 AI 模型。另外,根据 Tom’shardware 在 2023 年 2 月 14 日的报道, 谷歌也正在开发类似 AWS Graviton.基于 Arm 架构的 5nm 服务器芯片;

2)亚马逊在 18 和 20 年发布 AI 推理芯片 nferentia 及训练芯片 Trainium,在 AWS 云供客户使用, 其投资的 Anthropic 将使用以上芯片来构建和部署 Al 应用。CPU 方面,基于 Arm 架 构的 Graviton 已于 18 年推出,目前已进入第三代;

3)Meta 针对推理的 MTIAv 自 20 年 开始设计,采用台积电 7nm 制程,公司预计于 25 年推出。

【基础设施端】亮点 2:Cobalt 100 基于 Arm 架构,性能比现有商用 Arm 服务器的数据 中心性能提高 40%。该芯片拥有 128 个核心,针对通用工作负载的性能、功率和成本效 益进行了优化,被称为“所有云计算供应商中速度最快的 CPU”,已经在微软的部分业务 中得到了应用并将于明年上市。微软称,初步测试表明,Cobalt 100 性能比现有商用 Arm 服务器的数据中心性能提高40%。选用Arm技术是微软可持续发展目标的一个关键因素, 其目标是优化整个数据中心的“每瓦性能”,这本质上意味着为每单位消耗的能量获得更多的计算能力。

[应用端]亮点3: Copilot for Microsoft 365 正式面向企业开放商用,潜力初体现。lE前,微软 Copilotfor Microsoft 365 的企业客户包括 Visa、BP 集团、本田和辉瑞、埃森哲安永、毕马威、勤达容和普华永道等。针对 Copilot 是否提高了生产力的问题,微软发布了《工作趋势指数报告 (WTI)》,报告表明 Copilot 确实帮助用户提高了生产力: 70%的用户表明其工作效率得到了提升: 68%的用户表示其工作质量提高了,总体而言,用户在特定任务 (如搜索、写作和总结) 上的效率提高了 29%。

[应用端]亮点4: Bing Chat 更名为 Copilot,“Copilot 无处不在”。微软 Copilot 新增专属网站,集成了GPT-4、DALL-E3 功能,登录微软账号即可免费使用。推出了 CopilotStudio,具有扩展 Copilot for Microsoft 365 的功能,用户可使用它自定义包含不同数据集、自动化流程的Copilot,类似于OpenAl新更新的GPTs 功能。同时发布了 Copilot for Azure.用户可使用该工具以聊天方式简化日常 IT 管理。

我们认为,算力基础设施已成为决定 AI 行业领先地位的关键因素之一,芯片的高成本和供不应求的背景使得自研成为科技大厂的一种出路。科技巨头们已经开始根据自身业务全流程进行全线布局,微软、亚马逊和谷歌等均发布了自研芯片,一方面各大巨头都在寻求摆脱对单一供应商的依赖,降低供应链风险: 另一方面自研专用芯片利于更针对性更及时响应自身 AI 训练和推理性能需求,为各大厂自己的产品发挥更好的协同效应,提高整体效率。

投资建议: 建议关注算力巨头在芯片领域的动态以及国内 AI 芯片厂商国产替代机会,如华为、寒武纪、云天励飞、龙芯中科等。

二、AI行业动态一览

2.1 国外行业动态

(1)力基础设施

[Cerebras 和 Core42 启动全球最大人工智能超级计算机的第二阶段]

加速生成人工智能的先驱 Cerebras Systems 和阿联首领先的技术控股集团 G42 宣布由九台互连超级计算机组成的 Condor Galaxy 网络已进入第二阶段建设。随着 CondorGalaxy 1 的完成,Cerebras 和 G42 已在 Condor Galaxy 2 (CG-2)项目上破土动工。CG-2 将拥有 4 exaFLOP 和 5400 万个 A 优化计算核心,完成后将 Condor Galaxy网络扩展至总共 8 exaFLOP 和 1.08 亿个核心。这是 Cerebras 和 G42 构建 36exaFLOP 人工智能超级计算机群计划的一个重要里程碑。(信息来源: VentureBeat)

(2)算法&大模型

[Silo Al 推出面向欧洲的新开源语言模型 Poro]

人工智能初创公司 Silo Al 本周推出了 Poro,这是一种新的开源大语言模型 (LLM),拥有342 亿参数,在 21 万亿代币多语言数据集的一部分上进行训练,涵盖英语、芬兰语以及Python 和 Java 等编程语言,旨在提升欧洲语言的多语言人工智能功能。Poro 是计划中的开源模型系列中的第一个模型,旨在最终覆盖所有 24 种欧盟官方语言。(信息来源:VentureBeat)

[谷歌 DeepMind 推出 GenAl 音创作模型 Lyria]

北京时间 2023年11月16 日消息,谷歌 DeepMind 推出了迄今为止最新、“最先进”的音乐人工智能系统,名为 Lyria。该公司表示,该模型可以生成模仿流行艺术家风格的高质量人声、歌词和背景音乐。DeepMind 同时在 YouTube Shorts 上推出新的音乐创作实验。其中一项名为“ Dream Track ”的实验将让创作者生成由多位艺术家演唱的 30 秒歌曲。(信息来源: VentureBeat)

[微软发布旗下最小参数语言模型 Phi-2]

微软在 Ignite 2023 大会中发布了旗下最小的语言模型 Phi-2,共有 27 亿参数,相比较此前版本有明显提升。微软表示 Phi-2 在逻辑推理和安全性方面显示出显著的改进。通过正确的微调和定制,小型语言模型是云和边缘应用程序的强大工具。根据“MT-Bench”基准测试,Phi-2 在某些方面优于 Meta 的 Llama-2-7B 模型。Phi-2 的聊天版本也在酝酿中,可能会解决该模型在这些领域的一些现有痛点。(信息来源: IT 之家)

(3)应用

[芯片软件设计公司推出 Al 设计助手 Synopsys.ai Copilot]

芯片设计软件公司 Synopsys 推出了 Synopsys.ai Copilot,作为用于设计半导体芯片的Al 驱动加速器。该公司表示,电子设计自动化 (EDA) 工具为副驾驶使用了突破性的生成人工智能 (GenAl) 功能。这项创新源于与微软的战略合作,利用 Azure OpenAl 服务将GenAl 的力量注入复杂的半导体芯片设计领域。(信息来源: VentureBeat)

[Meta 发布用于围像编辑的 Emu Edit 和用于视频生成的 Emu Video]

北京时间 11 月 16日,Facebook 和 Instagram 的母公司 Meta 公布了人工智能 ( Al)内容创建和编辑工具的重大进展:用于图像编辑的Emu Edit和用于视频生成的Emu Video.通过Emu Edit,用户可以输入基于文本的指令来更改图像。Emu Video 工具则基于扩散模型,用户可以输入文本、图像生成视频。(信息来源: VentureBeat)

[南洋理工大学科研团队开发 DIRFA:输入图片和音频,可生成说话视频]

IT 之家 11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore) 的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。(信息来源: IT 之家)

2.2 国内行业动态

(1)算法&大模型

[夸克 App 推出自研大模型:千亿级参数、CMMLU 榜单第一]

IT 之家 11 月 14 日消息,阿里巴巴智能信息事业群发布今日发布了夸克大模型,该模型优先落地在通识问答、专业搜索等信息服务领域,将应用于夸克旗下一系列 App 中,令App 变身为“AI 助手”。(来源: IT 之家)

(2)应用

[浙江卫健委推出可陪诊数宇健康人“安诊儿”: 基于支付宝技术,可提供全流程陪伴]

IT 之家 11 月 16 日消息,在 11 月 15 日的第九届浙江国际健康产业博览会暨第二届浙江省数字健康大会期间,浙江省卫生健康委联合支付宝推出了可陪诊数字健康人“安诊儿”(对应英文名“Angel”)。安诊儿”利用支付宝自主研发的数字人技术打造,采用支付宝的 Web3D 互动引擎 Galacean,可覆盖市面上 97% 的智能手机机型。

功能方面,“安诊儿”可实现与患者的实时引导、流畅交互,为用户提供预约挂号、在线取号、排队叫号、扫码支付、报告查询、居家护理、复诊续方等线上服务的“一站式”串联。目前,“安诊儿”已在浙江大学医学院附属第一医院、浙江大学医学院附属邵逸夫医院等浙江全省 30 家医院应用。(信息来源: IT 之家)

[金山办公 WPSAI 开启公测,面向全体用户陆续开放体验]

T之家 11 月 16 日消息,金山办公宣布,WPSAI 开启公测,面向全体用户陆续开放体验。WPSA 的功能覆盖文字、表格、演示几个方面,感兴趣用户可自行在WPSAI官网下载体验。(信息来源: IT 之家)

[京东 App 上线京言 AI 助手测试版: 提供专业品类咨询、产品对比等功能]

IT之家 11 月 14 日消息,京东 App 现已上线京言 AI 助手测试版,用户搜索“京东京言”后点击即可进入。据介绍,京言 AI 助手一款 AI 智能导购助手,可以为用户提供以下功能: 专业品类咨询、个性化送礼助手、产品对比助手、分享购物经验知识。

在此前举行的 2023 年乌镇峰会互联网企业家论坛上,京东集团 CEO 许舟表示: 京东产业大模型 - 言犀大模型,已经在消费导购、商家经营、客服售后、医疗问诊等多个供应链场景中试点接入。此外,京东也已经开始测试 AIGC 自动生成商品营销图文的能力,目前已推广至 2000 多个零售三级品类。后续会将大模型能力开放给更多品牌商家。(信息来源: IT 之家)

2.3 行业展会/大会前瞻梳理

[11 月中旬,新加坡将举行 2023 年新加坡金融科技节]

2023 年新加坡金融科技节 (SFF) 的主题为“人工智能 (AI)在金融服务中的应用”(Applications of Artificial Intelligence (Al) in Financial Services)。SFF 2023 将重点关注人工智能的发展和采用,以及这项技术如何潜在地用于金融服务。(信息来源: 新浪新闻)

[12月15日,广州将举办2023 年粤港澳大湾区人工智能产业大会]

2023 年 12月15日,广东省人工智能产业协会将在广州举办 2023 年港澳大湾区人工智能产业大会。本届大会以“点亮 AI 智慧之光,引领智能时代变革”为主题,将汇聚人工智能领域的顶尖专家、高校学者、企业家、品牌创始人。(信息来源:广东省人工智能产业协会)

[2023 广州国际人工智能展将于 12 月召开]

2023年 12月20-22 日,广州国际人工智能展览会将在广州琶洲-保利世贸博览馆举办。本次展览会以“智赋科技,物联未来”为主题,聚焦全球 AIOT 产品创新、加快智能物联网行业发展,推动物联网智能化升级。(信息来源: aichina)

三、AI行情回顾: AI板块涨幅明显,:华为异腾产业链标的和算力租赁板块涨幅居前

2023年11月13日-2023年 11月17 日,我们构建的西部Al 股票池中,其中 109家A股公司整体周平均涨幅 4.72%,53 家美股公司整体周平均涨幅 4.14%。A 股公司中,华为并腾产业链标的板块涨幅为 8.53%,排名第一,涨幅最弱的为交换机板块,涨幅 0.12%。美股公司中,以 Al应用版块涨幅居首,为 5.22%,其次为 AI 芯片板块和光膜块板块,涨幅最弱的为 AI 服务器板块,涨幅 1.66%。

报告共计:12页

海量/完整电子版/报告下载方式:公众号《人工智能学派》


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1