【Triton教程】向量相加

作者：HyperAI超神经发布时间：2024-10-17

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。

更多 Triton 中文文档可访问 →https://triton.hyper.ai/

在本教程中，你将使用 Triton 编写一个简单的向量相加 (vector addition) 程序。

你将了解：

Triton 的基本编程模型
用于定义 Triton 内核的 triton.jit 装饰器 (decorator)
验证和基准测试自定义算子与原生参考实现的最佳实践

计算内核

创建一个辅助函数从而： (1) 生成 z 张量，(2) 用适当的 grid/block sizes 将上述内核加入队列：

使用上述函数计算两个 torch.tensor 对象的 element-wise sum，并测试其正确性：

Out:

现在准备就绪。

基准测试

在 size 持续增长的向量上对自定义算子进行基准测试，从而比较其与 PyTorch 的性能差异。为了方便操作，Triton 提供了一系列内置工具，允许开发者简洁地绘制自定义算子在不同问题规模 (problem sizes) 下的的性能图。

运行上述装饰函数 (decorated function)。输入查看性能数据，输入 show_plots=True 绘制结果，以及/或者输入 save_path='/path/to/results/' 将其与原始 CSV 数据一起保存到磁盘：

out:

近期资讯

全民参与：人民建议征集平台上线！

随着社会的快速发展和科技的日新月异，政府与社会公众之间的互动变得越来越重要。为了更好地了解民意，汇聚民智，促进全民参与社会建设，近期人民建议征集平台正式上线，为公众提供了一个发声和建言献策的平台。一、人民建议征集平台的背景与意义随着网络技术的普及和发展，网络已经成为人们获取信息、交流思想的重要渠道。政府通过搭建网络平台征集民意，不仅可以更加便捷地了解公众的需求和关切，还能汇聚全社会的智慧和力量，共同推动社会进步。人民建议征集平台的上线，正是政府贯彻群众路线、加强建设的重要举措。它不仅为公众提供了

森普软件 2024-10-16

维修工具安全风险管控

安全生产文库 2024-10-16

NCS智能分子膜发酵装备、ECS膜式智能堆肥箱助力农业绿色发展

NCS智能分子膜发酵系统成套化装备整套设施装备可广泛应用于农业、牧业，将畜禽粪便、农作物秸秆、有机污泥、园林垃圾、厨余垃圾等有机废弃物转化为可供作物利用的高品质的有机肥料、营养土及牛床垫料，有效提升耕地质量，使作物达到绿色或有机标准，在实现畜禽粪便的资源化和高质化利用的同时，为养殖企业和农户提供了一种环保、易操作、低成本的农业废弃物利用途径，实现了农业绿色发展。NCS智能分子膜发酵系统成套化装备整套设施装备包括了：核心模块发酵装备：NCS智能分子膜发酵系统。前端预处理模块：斜筛式固液分离机、微滤式固液分离

中海环境 2024-10-16

龙鳞Ace Extreme会员日超超超超前首发

龙鳞Ace Extreme本月外设会员日超超超超前首发全体会员均可参与，LV7再抢先1天完成任务还能再赢ROG鼠标收纳展示盒！

硕小胖胖胖 2024-10-16

附录二：.wav文件和 .wem文件的相互转换

本文作为MHW语音包mod制作的附录。但是其实单独拿出来也可以写一篇。所以我单独拿出来写一篇。一： .wav文件转 wem文件使用工具：Wwise（不是wwiseutil！）1. 下载Audiokinetic启动器： https://www.audiokinetic.com/zh/download 需要注册账号。别瞎填等会还要用！2. 安装启动器，打开启动器，登陆刚注册的账号。安装2018年版本的Wwise。2024版无法完成转换，别问。别的老版本能不能用，我不清楚，但我可以确定2018版一定能用。具

Rodyy_ 2024-10-16

【Triton教程】向量相加

计算内核

基准测试

推荐体验

相关资讯

2023年的深度学习入门指南(9) - Triton

科技公司竞相加码人工智能赛道

微短剧+AIGC，两火相加大于2不？

市场活力增强科技公司竞相加码人工智能赛道

百亿级向量检索的向量数据库是如何构建的？

近期资讯

全民参与：人民建议征集平台上线！

维修工具安全风险管控

NCS智能分子膜发酵装备、ECS膜式智能堆肥箱助力农业绿色发展

龙鳞Ace Extreme会员日超超超超前首发

附录二：.wav文件和 .wem文件的相互转换

直达二本学历进了大厂前端，我才发现世界就是一个巨大的草台班子

没有固定收入，李白如何负担得起古代的旅行？

硝酸根离子检测仪的优势及应用范围

广州铝合金脚手架哪家好

印度宣布从美国采购31架MQ-9B无人机将在本土组装总价值高达34亿美元

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响