英伟达现已发布2024财年第三财季财报,带来了一份远超预期的财报成绩。实现收入181.2亿美元,同比上涨206%,远高于市场预期的162亿美元;净利润92.4亿美元,高于市场预期的72亿美元。不过,由于在财报中明确表示下季度业绩将受到美国芯片出口限制的负面影响,当日,英伟达股价收于499.44美元,在盘后下跌超1%。
NVIDIA创始人兼首席执行官黄仁勋表示:“我们的强劲增长反映了广泛的行业平台从通用型到加速计算和生成式AI的转变。”黄仁勋强调,继大模型初创公司、消费互联网公司和全球云服务提供商之后,国家和地区级云解决方案提供商(CSP)和软件公司都加入了AI的使用的建设,企业们也开始创建自定义AI来对全球最大的一些行业进行自动化,下一波浪潮正在开始,“生成式AI时代正在起飞”。
从细分业务来看,包括AI芯片业在内的数据中心营收145.1亿美元,同比增长279%,远超市场预期的128.2亿美元,财报显示,数据中心收入的一半来自云计算基础设施提供商,另一半来自消费者互联网组织和大公司。克雷斯在电话会上谈到,从专门向客户出租GPU的云服务处看到了稳健的增长。
在本季度,英伟达在游戏领域推出了引入光线重建功能的DLSS3.5技术和Windows版Tensor RT-LLM库,本季度游戏业务营收28.6亿美元,同比增长81%,高于市场预期的27亿美元。另外,专业可视化业务营收4.16亿美元,同比增长108%;汽车业务营收2.61亿美元,同比增长4%。
对于下季度的指引,英伟达预测在数据中心的强大驱动下,公司四季度的销售额将达到200亿美元,上下浮动2%。黄仁勋在电话会上也表示,在2025财年,数据中心业务“一定还会继续增长”。不过,英伟达也预计,由于美国商务部发布了一系列新的芯片出口限制,下季度业绩会受到负面影响。
英伟达首席财务官科莱特·克雷斯(Colette Kress)在财报后的电话会上表示,英伟达正在与来自中国和中东的一些客户合作,以获得购买公司高性能产品的美国政府许可。克雷斯也谈到,来自中国的业务占数据中心总营收的20%-25%,预计将大幅减少,但将得到其他地区强劲增长的抵消。克雷斯透露,英伟达正在开发符合美国政府政策且不需要许可证的数据中心新产品,有望在未来几个月内上市,但她认为这些产品不会在第四财季的业绩中得到体现、在整体收入中贡献重要占比。
此前英特尔在路线图上已经展示了后续将会推出的下一代低功耗平台Lunar Lake系列,将会采用全新的制程工艺和核心设计,专为8W至30W低功耗系统设计。目前外网已经曝出了该系列处理器的详细设计参数,带来了更多信息。
英特尔声称Lunar Lake是与微软共同开发的,旨在实现高能效的软件/硬件集中。该系列处理器将配备NPU4.0(神经处理单元),并且配备了下一代的Xe2-LPG核显,这也是目前已知的第一款将配备“Battlemage”架构GPU的产品。
该GPU架构拥有64个矢量引擎,支持Systolic AI/Super Scaling技术,并支持实时光线追踪。此外,该系列处理器将支持DisplayPort1.4、HDMI2.1、eDP1.4和1.5显示支持,并提供硬件VVC/H.266视频解码支持。
Lunar Lake架构将在封装中附带内存,将有16GB和32GB可供选择,最高可以配备LPDDR5X-8533内存,采用MoP封装,这将带来更好的功耗表现以及更小的核心及内存占用面积。根据曝光的图片来看,英特尔正在准备至少四种具有不同CPU和GPU核心的配置。
CPU将会基于Lion Cove性能核和Skymont能效核的组合,并且将会采用台积电N3B制程制造,具体的SKU如下:
酷睿7 32GB内存版:4P+4E+8Xe2-LPG
酷睿7 16GB内存版:4P+4E+8Xe2-LPG
酷睿5 32GB内存版:4P+4E+7Xe2-LPG
酷睿5 16GB内存版:4P+4E+7Xe2-LPG
扩展方面,Lunar Lake系列将支持PCIe gen5×4和gen4×4接口,带有Thunderbolt 4接口和最多三个USB4接口。该芯片通过基于CNVio3接口的BE201网卡集成了WiFi7和蓝牙5.4支持。
而在功耗表现上,传闻称Lunar Lake的一个特殊8W SKU可以在没有风扇的情况下运行,其他版本将在17W至30W TDP范围内运行。此外,据称12W版本的Arc Xe2-LPG核显可提供2.5TFLOPS的单精度计算性能,与Apple M1芯片相当。
英特尔今年9月宣布,将于12月14日推出代号为Meteor Lake的酷睿Ultra 1代移动处理器。
英特尔为了激发消费者对新款移动处理器的兴趣,在官方发布的最新一期视频中,图形部门的高级工程师 Tom Petersen 详细介绍了核显性能。他表示相比较第12代Alder Lake芯片,Meteor Lake核显的每瓦图形性能提高1倍。
Petersen表示英特尔Meteor Lake的核显之所以有如此大的突破,主要是因为提高了时钟速度、优化了架构,并使用更大的iGPU单元。
GPU 通常由三部分组成:
图形引擎:处理3D图像
显示模块:负责将信号输出到屏幕
媒体引擎:负责编码和解码视频
Petersen在视频的开头部分解释说,Meteor Lake采用分解架构,极具创意地优化了核显架构。Meteor Lake的iGPU媒体引擎实际上位于SoC chiplet中,而不是主集成图形单元中,这可以显著降低功耗,延长续航表现。iGPU chiplet采用Xe-LPG图形架构,直接处理三维图形、计算功能和一些AI算法的操作。
Xe-LPG的图形架构基本上和Xe-HPG(第12/13代CPU核显所用架构)相同,但缺少了XMX硬件矩阵引擎,Xe-LPG保留了对通用DP4a着色器指令的支持,可以支持XeSS采样技术。
Petersen还解释说,Meteor Lake集成显卡通过增加图形核心的工作频率获得了性能提升,这不仅是由于集成显卡结构的总体优化,也是由于向新技术程序的过渡。Meteor Lake处理器的集成图形小芯片采用台积电N5工艺技术制造。与Alder Lake处理器的Xe-LP显卡相比,它同时针对更低的工作电压和更高的时钟速度进行了优化。