【TVM 教程】规约（reduce）

作者：HyperAI超神经发布时间：2024-10-16

Apache TVM 是一个端到端的深度学习编译框架，适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 → https://tvm.hyper.ai/

作者：Tianqi Chen

本文介绍如何在 TVM 中规约（reduce）。关联规约算子（如 sum/max/min）是线性代数运算的典型构造块。

描述行的总和

在 NumPy 语法中，计算行的总和可以写成 B = numpy.sum(A, axis=1)

下面几行描述了行求和操作。为创建一个规约公式，用 te.reduce_axis 声明了一个 reduction 轴，它接收规约的范围。 te.sum 接收要规约的表达式以及 reduction 轴，并计算声明范围内所有 k 值的总和。

等效的 C 代码如下：

Schedule 规约

有几种方法可以 Schedule Reduce，先打印出默认 Schedule 的 IR 代码。

输出结果：

IR 代码与 C 代码非常相似，reduction 轴类似于普通轴，可以拆分。

以下代码按不同的因子将 B 的行轴和轴进行拆分，得到一个嵌套 reduction。

输出结果：

把 B 的行绑定到 GPU 线程，从而构建一个 GPU 内核。

输出结果：

规约因式分解和并行化

构建规约时不能简单地在 reduction 轴上并行化，需要划分规约，将局部规约结果存储在数组中，然后再对临时数组进行规约。

rfactor 原语对计算进行了上述重写，在下面的调度中，B 的结果被写入一个临时结果 B.rf，分解后的维度成为 B.rf 的第一个维度。

输出结果：

B 的调度算子被重写为 B.f 的规约结果在第一个轴上的和。

输出结果：

跨线程规约

接下来可以在因子轴上进行并行化，这里 B 的 reduction 轴被标记为线程，如果唯一的 reduction 轴在设备中可以进行跨线程规约，则 TVM 允许将 reduction 轴标记为 thread。

也可以直接在规约轴上计算 BF。最终生成的内核会将行除以 blockIdx.x，将 threadIdx.y 列除以 threadIdx.x，最后对 threadIdx.x 进行跨线程规约。

输出结果：

结果内核与 NumPy 进行比较来验证结果内核的正确性。

用二维规约描述卷积

在 TVM 中，用简单的二维规约来描述卷积（过滤器大小 = [3, 3]，步长 = [1, 1]）。

输出结果：

定义一般交换规约运算

除了 te.sum, tvm.te.min 和 tvm.te.max 等内置规约操作外，还可以通过 te.comm_reducer 定义交换规约操作。

总结

本教程演示了如何规约 schedule。

用 reduce_axis 描述规约。
如需并行性（parallelism），用 rfactor 来分解轴。
通过 te.comm_reducer 定义新的规约操作。

相关资讯

【TVM 教程】使用 Relay Visualizer 可视化 Relay

Apache TVM 是一个端到端的深度学习编译框架，适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 → Apache TVM 是一个端到端的深度学习编译框架，适用于 C

深度学习机器学习

神经星星 2024-09-26

【TVM 教程】在 CPU 上部署 Hugging Face 剪枝模型

作者：Josh Fromm 本教程演示如何采用剪枝后的模型（本例中模型是来自 Hugging Face 的 PruneBert），并使用 TVM 来利用模型稀疏支持来加速。尽管本教程的主要目的是在

Hugging Face

神经星星 2024-08-05

近期资讯

如何应对电脑蓝屏问题：从重启到系统重装的解决方案

电脑蓝屏，这个词可能让很多人感到头疼。突然间，屏幕上弹出一个蓝色的窗口，显示着各种错误信息，整个电脑就像被“定住”了一样。你可能正在忙着写报告、玩游戏或者追剧，结果一切都被打断了。这时候，你该怎么办？首先，蓝屏其实是Windows系统的一种保护机制。当系统检测到严重错误，无法安全运行时，它会自动停止工作，以防止数据丢失或硬件损坏。

新报观察 2024-12-30

选择合适字体提升文字表达效果的技巧与建议总结

不论是写文章、做PPT，还是在社交媒体上发布内容，字体的变化可以直接影响到读者的感受和理解。因此，学会如何改字体、选择合适的字体，变得尤为重要。说到改字体，首先要知道不同的应用软件和平台有各自的字体设置方法。比如在Word里，你可以简单地通过上方的工具栏，选择“字体”下拉菜单，找到你喜欢的字体进行更改。

新报观察 2024-12-30

如何在下划线上打字的技巧与方法，提升填写效率与美观度

在日常生活中，我们经常会遇到需要在下划线上打字的情况，比如填写表格、制作文档或者设计一些简单的图表。虽然这看起来是个小问题，但如果不懂得怎么操作，可能会让人感到困惑。接下来，我就来聊聊怎么在下划线上打字，以及一些实用的小技巧。首先，咱们得了解一下什么是下划线。简单来说，下划线就是一条横线，通常用来强调某些内容或者指示需要填写的信息。

新报观察 2024-12-30

失去微信后的生活反思：重拾真实交流与简单快乐的契机

但此刻，没有微信的你，只能翻阅手机中的其他外卖应用，寻找合适的食物。没有微信的日子，反而可以让我们重新审视自己的生活方式。

新报观察 2024-12-30

如何有效寻找并加入合适的社交群组，享受交流乐趣

在这个信息爆炸的时代，社交软件如雨后春笋般涌现，各种社群、群组层出不穷，无论是兴趣爱好、学习交流，还是工作讨论，大家都能找到合适的地方来沟通和分享。然而，很多人可能会面临一个困扰，那就是“怎么找群”。今天，就让我来聊聊这个话题，希望能对你有所帮助。首先，确定你的兴趣点是关键。

新报观察 2024-12-30

如何在QQ中轻松发送文件夹的详细步骤与技巧分享

你可以将压缩后的文件夹上传到这些云盘，然后将生成的分享链接发送给对方。再说回QQ，除了基本的文件发送，QQ还有一些其他有趣的功能，比如可以创建群聊，方便团队合作。

新报观察 2024-12-30

制作实用目录的重要性与方法：提升文章可读性与专业性

在写作过程中，很多朋友可能会觉得目录不是特别重要，尤其是对于一些短篇文章或者随笔来说，似乎没必要花时间去弄一个目录。然而，实际上无论是论文、书籍还是较长的文章，目录都是非常关键的一个部分。它不仅可以帮助读者快速找到他们感兴趣的内容，还能让整篇文章看起来更有条理、更专业。今天，就跟大家聊聊怎么弄一个实用的目录。

新报观察 2024-12-30

如何在不同Windows系统中卸载IE浏览器的详细操作步骤解析

说到卸载IE浏览器，很多人可能都会皱眉，这个老旧的浏览器在今天的网络环境中几乎是个“累赘”。虽然微软已经推出了Edge浏览器，IE的使用频率却依然不低，很多人出于习惯或者某些特殊需求仍然在使用。不过，如果你决定要把它卸载掉，今天这篇文章就来帮你理清楚操作步骤。

新报观察 2024-12-30

选购电视机的八大关键要素，助你找到理想选择

视频等等。如果你平时喜欢追剧或者玩游戏，确保你的电视能下载到你常用的应用，这样才能玩得尽兴。还有就是，智能电视的连接性也很重要，看看它能否与其他设备（如音响、游戏机）无缝连接。音质：别忽视了音响效果画面好固然重要，但音质也绝不能忽视。很多电视的内置音响效果一般般，如果你希望获得更好的视听体验，可以考虑额外购买一个音响系统或者音响条。

新报观察 2024-12-30

初学者必读：如何打开浏览器及实用技巧详解

打开浏览器，听起来似乎是件简单的事情，但实际上，对于一些初学者或者对电脑不太熟悉的人来说，这个过程可能会显得有些复杂。

新报观察 2024-12-30

【TVM 教程】规约（reduce）

描述行的总和

Schedule 规约

规约因式分解和并行化

跨线程规约

用二维规约描述卷积

定义一般交换规约运算

总结

推荐体验

相关资讯

【TVM 教程】使用 Relay Visualizer 可视化 Relay

【TVM 教程】在 CPU 上部署 Hugging Face 剪枝模型

模型配布规约

冯思远：Apache TVM 与机器学习编译发展

青记独家丨技术“道德化”：人机传播伦理规约的内在逻辑

近期资讯

如何应对电脑蓝屏问题：从重启到系统重装的解决方案

选择合适字体提升文字表达效果的技巧与建议总结

如何在下划线上打字的技巧与方法，提升填写效率与美观度

失去微信后的生活反思：重拾真实交流与简单快乐的契机

如何有效寻找并加入合适的社交群组，享受交流乐趣

如何在QQ中轻松发送文件夹的详细步骤与技巧分享

制作实用目录的重要性与方法：提升文章可读性与专业性

如何在不同Windows系统中卸载IE浏览器的详细操作步骤解析

选购电视机的八大关键要素，助你找到理想选择

初学者必读：如何打开浏览器及实用技巧详解

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响