我找到了AlexNet当年的源代码，没用框架，从零手撸CUDA/C++

作者：人工智能大讲堂发布时间：2024-06-03

2012年，对人工智能来说是不平凡的一年，AlexNet赢得了当年的ImgeNet挑战赛，这件在当时看似平常的事却引起了全世界的关注，因为它是第一个赢得该赛事的神经网络模型，从此，人工智能开始由传统机器学习向深度学习过渡。

AlexNet赢得挑战赛后，辛顿和另两位作者立刻成立了DNN Research Inc，并最终以4400万美元的价格拍卖给谷歌。除了谷歌，其它所有的科技公司也都加入到了这场科技界的军备竞赛中，包括远在大洋彼岸的百度，它是这次竞拍的主要发起人。

严格意义上讲，AlexNet并不是第一个神经网络模型，而是Yann LeCun在1998年提出的LeNet，但当时由于算力不足和缺少数据，所以并没有得到广泛应用，在AlexNet赢得比赛后，Yann LeCun也是连夜开会进行复盘总结（为什么不是LeNet？）。虽然LeNet没有成为第一个受到关注的神经网络模型，鉴于他的贡献，Yann LeCun和辛顿后来都被授予了图灵奖。

12年后的今天，深度学习已经成为主流，神经网络在CV，NLP等领域得到广泛应用，CNN和Transformer模型架构也是遍地开花，更幸运的是，我们在开发AI应用过程中，到处都是好用的工具和框架，但这有时也成了一种幸福的烦恼。

各种算子是如何实现？

数据是如何组织？
计算是如何并行化？

主机和GPU如何传输数据？

反向传播怎么计算梯度？

我们对这些细节知之甚少。

在2012年，AlexNet可没那么幸运，当时没有任何成熟的深度学习框架可用于模型训练或者推理。一切只能从零开始，我们在AlexNet另一个作者Alex Krizhevsky主页上找到了AlexNet的源代码，作者使用CUDA/C++从零开始实现模型训练和推理过程。

项目主页：https://code.google.com/archive/p/cuda-convnet/

源代码：https://github.com/ulrichstern/cuda-convnet

这份代码为我们学习神经网络背后的原理提供了一个捷径。

项目主要由Python和C++代码组成，Python用于组织和处理数据，C++则实现了各种算子、网络结构、前向计算和反向传播以及调用CUDA进行并行计算。并通过Python/C API实现C++代码操作Python对象。

定义网络结构

AlexNet通过配置文件构造网络结构，配置文件中每一个[]都代表网络结构中的一层，data代表输入层，conv代表卷积层，pool代表池化层，fc代表全连接层，每一层通过后面的配置项指定了输入、输出等属性。neuron指定激活函数。

在源代码中采用C++面向对象的思想，每一个概念都对应一个类。

编译

训练

代码编译完成后，通过下面代码就可以开始模型训练。

相关资讯

深度学习入门2自制框架PDF源代码学习指导

[图片] [图片] [图片] [图片] [图片] [图片] [图片] 深度学习框架中蕴藏着惊人的技术和有趣的机制，旨在揭开这些技术和机制的神秘面纱，帮助正确理解技术，体会它们的有趣之处。从零开始创建一个深度学习框架——DeZero。DeZero 是原创的框架，它用最少的代码实现了现代深度学习框架的功能。分60 个步骤来完成这个框架，在此过程中，会加深对PyTorch、TensorFlow 和Chainer 等现代深度学习框架的理解，看清深度学习框架的本质。如今，深度学习正在推动各个领域的创新。自动驾驶

深度学习编程自动驾驶

zhangyyh 2024-02-03

ChatGPT的成功密码是啥？我想我找到了

最近，ChatGPT一直在人海中狂飙。这股热情，就像我加入的ChatGPT微信群里调戏AI的99+消息一样炽热。甚至是《财富》杂志也给予了高度的评价：在一代人的时间中总有一种产品的出现，它将从

ChatGPT

2023-02-20

我找到了AlexNet当年的源代码，没用框架，从零手撸CUDA/C++

推荐体验

相关资讯

深度学习入门2自制框架PDF源代码学习指导

ChatGPT的成功密码是啥？我想我找到了

ai自动写文章源代码（源代码文本）

C++新手写的单链表

我真惊了《图深度学习》让我找到了！

近期资讯

重庆亲笔签申请基于深度学习的长文本笔迹识别专利，提升长文本笔迹识别的精度

江苏长天智远申请基于云原生技术的高速公路自由流收费专利，避免某些通道过载而其他通道空闲

广州裕富联申请种POS机业务巡检系统专利，能快速实现外勤人员巡检的风险排查

朝阳闽龙陶瓷取得精准定位喷墨印花装置专利，提高印花效果

中特生命健康科技取得具有定位功能的线段短停静态打码装置专利，保证码位置统一

通号通信申请铁路线路智能巡检专利，提高故障发现及时性和处理故障效率

中科制造（深圳）集团取得锂电池加工用喷码机专利，降低喷码机喷码到其他位置的概率

融众易达取得微型打印机专利，增加打印纸进入走纸间隙中的张力

广东中南钢铁申请高炉本体巡检系统及巡检方法专利，能够实现对高炉本体巡检作业的自动化

宇文星光电取得电子元件加工用打标设备专利，能够稳定夹持并反转电子元件实现多方位喷印打标

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响