全新神经网络架构KAN一夜爆火，能干掉MLP？数学遇上人工智能，深度学习迎来最强挑战者

作者：人工智能-研究所发布时间：2024-05-06

人工智能深度学习机器学习编程

无需怀念MLP，新网络KAN基于柯尔莫哥洛夫-阿诺德定理，带着更少的参数、更强的性能、更好的可解释性来了，深度学习架构革新进入新时代！

一夜之间，机器学习范式要变天了！

当今，统治深度学习领域的基础架构便是，多层感知器（MLP）——将激活函数放置在神经元上。

与传统的MLP架构截然不同，且能用更少的参数在数学、物理问题上取得更高精度。

论文代码+研究生及SCI论文攻略及润色资料包+论文指导发刊+kaggle带队拿牌+

关注微信公众号：学长论文指导，回复211 获取

AI交叉学科、SCI、CCF-ABC、期刊、会议、本硕博论文、在职论文指导、Kaggle带队拿牌、润色发刊等论文辅导

比如，200个参数的KANs，就能复现DeepMind用30万参数的MLPs发现数学定理研究。

不仅准确性更高，并且还发现了新的公式。要知道后者可是登上Nature封面的研究啊~

在函数拟合、偏微分方程求解，甚至处理凝聚态物理方面的任务都比MLP效果要好。

而在大模型问题的解决上，KAN天然就能规避掉灾难性遗忘问题，并且注入人类的习惯偏差或领域知识非常容易。

来自MIT、加州理工学院、东北大学等团队的研究一出，瞬间引爆一整个科技圈：Yes We KAN！

对MLP“进行一个简单的更改”

跟MLP最大、也是最为直观的不同就是，MLP激活函数是在神经元上，而KAN把可学习的激活函数放在权重上。

从数学定理方面来看，MLP的灵感来自于通用近似定理，即对于任意一个连续函数，都可以用一个足够深的神经网络来近似。

而KAN则是来自于 Kolmogorov-Arnold 表示定理 (KART)，每个多元连续函数都可以表示为单变量连续函数的两层嵌套叠加。

KAN的名字也由此而来。

正是受到这一定理的启发，研究人员用神经网络将Kolmogorov-Arnold 表示参数化。

为了纪念两位伟大的已故数学家Andrey Kolmogorov和Vladimir Arnold，我们称其为科尔莫格罗夫-阿诺德网络（KANs）。

而从算法层面上看，MLPs 在神经元上具有（通常是固定的）激活函数，而 KANs 在权重上具有（可学习的）激活函数。这些一维激活函数被参数化为样条曲线。

在实际应用过程中，KAN可以直观地可视化，提供MLP无法提供的可解释性和交互性。

不过，KAN的缺点就是训练速度较慢。

对于训练速度慢的问题，MIT博士生一作Ziming Liu解释道，主要有两个方面的原因。

一个是技术原因，可学习的激活函数评估成本比固定激活函数成本更高。

另一个则是主观原因，因为体内物理学家属性抑制程序员的个性，因此没有去尝试优化效率。

对于是否能适配Transformer，他表示：暂时不知道如何做到这一点。

以及对GPU友好吗？他表示：还没有，正在努力中。

天然能解决大模型灾难性遗忘

再来看看KAN的具体实现效果。

神经缩放规律：KAN 的缩放速度比 MLP 快得多。除了数学上以Kolmogorov-Arnold 表示定理为基础，KAN缩放指数也可以通过经验来实现。

在函数拟合方面，KAN比MLP更准确。

而在偏微分方程求解，比如求解泊松方程，KAN比MLP更准确。

研究人员还有个意外发现，就是KAN不会像MLP那样容易灾难性遗忘，它天然就可以规避这个缺陷。

好好好，大模型的遗忘问题从源头就能解决。

在可解释方面，KAN能通过符号公式揭示合成数据集的组成结构和变量依赖性。

人类用户可以与 KANs 交互，使其更具可解释性。在 KAN 中注入人类的归纳偏差或领域知识非常容易。

研究人员利用KANs还重新复现了DeepMind当年登上Nature的结果，并且还找到了Knot理论中新的公式，并以无监督的方式发现了新的结不变式关系。

DeepMind登Nature研究成果

Deepmind的MLP大约300000 个参数，而KAN大约只有200 个参数。KAN 可以立即进行解释，而 MLP 则需要进行特征归因的后期分析。并且准确性也更高。

对于计算要求，团队表示论文中的所有例子都可以在单个CPU上10分钟内重现。

虽然KAN所能处理的问题规模比许多机器学习任务要小，但对于科学相关任务来说就刚刚好。

比如研究凝固态物理中的一种相变：安德森局域化。

好了，那么KAN是否会取代Transformer中的MLP层呢？

有网友表示，这取决于两个因素。

一点是学习算法，如 SGD、AdamW、Sophia 等—能否找到适合 KANs 参数的局部最小值？

另一点则是能否在GPU上高效地实现KANs层，最好能比MLPs跟快。

最后，论文中还贴心的给出了“何时该选用KAN？”的决策树。

转载自 | 量子位

作者 | 白交衡宇

手把手带你从做科研到论文发表，一条龙全方位指导！避免各种常见or离谱的坑，顺顺利利学习，快快乐乐毕业~

0基础也能发论文吗?导师放养？毕业压力？找不到热点课题和方向没有idea、没有数据集，实验验证不了、代码跑不通没有写作基础、不知道论文的含金量，高区低投、不清楚不了解完整的科研经验;评职称？、申博压力、自我高区位的追求

在【学长论文指导】VX公众号后台回复：211，获取论文代码，赶快学起来！

论文指导发刊的【AI交叉学科、SCI、CCF-ABC、期刊、会议、本硕博论文、在职论文指导、大佬Kaggle带队拿牌、润色发刊等】

近期资讯

小米SU7订车半年未交车！车主在线投诉，怎么解？

近日，来自江苏的何女士通过网络平台投诉，称其6月30日下定的小米SU7，至今未交车。和她差不多时间下单的朋友已经提车了，这让她对小米汽车交付订单的标准产生了质疑。事情经过根据何女士的描述，她在今年6月30日交了定金，7月2日进行了锁单。在三周前，交付时间显示5-8周，销售顾问表示不会再更新进度。三周后，交付时间又更新成了3-6周。销售顾问表示车辆还在生产中。何女士每次在交付群中询问交付进度，要么是几小时才回复，要么几天才回复，甚至不回复，直到打了400电话投诉才回复。当初销售顾问说最快月初就能交车，结果现

律驰驾道 2024-12-25

岚图汽车2025 剑指 20 万销量巅峰，强势崛起引领新能源浪潮

2024年12月24日，岚图汽车在京宣布了其雄心勃勃的2025年发展战略，明确了销量目标和产品规划，展现出强劲的发展势头和坚定的进取决心。岚图汽车总经理助理、销售公司总经理邵明峰升任副总经理、销售公司总经理后，带领团队制定了一系列积极的发展举措。邵明峰表示，2025年岚图汽车将全力冲刺年销20万辆的目标。为此，岚图计划推出4款以上全新或改款车型，进一步完善其在SUV、MPV、轿车品类的布局，以满足消费者日益多样化和个性化的需求。回顾2024年，岚图汽车在竞争激烈的大环境中实现了“拔节式生长”。岚图汽车成绩

车道纵横 2024-12-25

工程机械智能控制器 SPC-FFMC-Y1620

SPC-FFMC-Y1620是长沙硕博电子科技股份有限公司自主开发的一款基于CoDeSys3.5编程的智能控制器。该产品具备3路CAN总线，36路IO资源。输入端口可采集高低电平、电压信号，输出为DO，3A，可直接驱动电磁阀，还具备20路PWM功能。此外，该产品还具有高防护等级、小体积、高集成度、高响应速度等优点，使其成为分布式应用场合的主控制器的理想选择。 [图片] 支持CoDeSys3.5编程36路输入，高端口复用率3路CAN，支持CANOpen/SAEJ1939/自定义20路PWM高边输出

硕博电子 2024-12-25

长安CS75 PLUS Ultra正式上市，售13.19万起

12月24日，长安汽车正式推出了第四代CS75 PLUS Ultra，该系列包含两款车型，官方售价分别为13.19万元与13.99万元。 [图片] 新车外观大体维持了现有车型的设计风格，但在细节上进行了优化，提升了车辆的独特性和未来感。其前脸继续采用宽大的进气格栅，内部以“V”形元素装饰，并与贯穿式LED灯带和两侧大灯组相连，增强了前脸的统一性。车身侧面线条流畅，配备了流行的隐藏式门把手，有助于降低风阻。车尾部分，新车采用了流行的贯穿式尾灯设计，与车头相呼应，而双边双出的排气布局则增添了运动气息。车身尺寸

言车司机 2024-12-25

比亚迪突然宣布，无图城市领航全国开通，智驾市场格局要变天！

距离2025年新年还有一周时间，比亚迪突然宣布，其高阶智能驾驶辅助系统“天神之眼”迎来重磅升级，即日起，无图城市领航功能在全国范围内正式开通，不管是城区道路还是乡间小路真正实现了“全国都能开，有路都好开”，这无疑是给车主们送上的年度大礼啊！ [图片] 据了解，此次升级的无图城市领航功能异常强大，可以完全不依赖驾驶员，实现复杂路口自主通行、红绿灯通行、自主超车并线和避障绕行等各种驾驶行为。甚至还支持全国各地的环岛通过、自动进入待转区等行业极具技术难度的功能，看完车主们的实际道路测试后，我真的被它的丝滑驾驶技

大智评测 2024-12-25

四川凉山彝族车位引导解决方案、停车诱导系统、空闲泊位导航

在四川凉山彝族地区，随着经济的发展和城市化进程的加速，机动车保有量持续攀升，停车难问题逐渐成为城市交通管理中的一个突出挑战。为了有效提升停车资源的利用效率，改善交通拥堵状况，引入先进的车位引导解决方案、停车诱导系统以及空闲泊位导航技术至关重要。一、凉山彝族地区停车现状分析凉山彝族地区的城市格局具有独特的特点，包括地形起伏、城区功能分区多样以及传统与现代建筑风格并存等。这些因素导致停车场分布较为分散，且部分停车场规模较小、布局不够规整。同时，由于旅游旺季和特殊活动期间，如彝族火把节等传统节日，外来车辆大

科拓股份 2024-12-25

盘点宝马原地打方向盘异响的通病

宝马原地打方向盘异响的通病主要包括以下几个方面：方向柱防尘套发出的响声：这可能是因为方向柱防尘套缺少润滑，产生干摩擦的声音。解决的办法是在防尘套内涂抹一些黄油，这样声音就会消失。气囊游丝干涉发出的声音：这种情况通常是因为气囊游丝损坏，需要及时更换。转向横拉杆球头老化、有旷量：更换转向横拉杆球头可以解决问题，但更换后需要做四轮定位。方向机防尘套漏油：可以通过更换防尘套或者重新打黄油来解决。转向机故障：如果打方向时传来“咯噔咯噔”的声音，可能是转向机配合齿轮间隙过大，需要更换转向机。 [图片] 平面

菲尔FREY 2024-12-25

聚察汽车 2024-12-25

全新神经网络架构KAN一夜爆火，能干掉MLP？数学遇上人工智能，深度学习迎来最强挑战者

对MLP“进行一个简单的更改”

天然能解决大模型灾难性遗忘

推荐体验

相关资讯

神经网络与深度学习

人工智能：深度学习和神经网络的应用和发展

人工智能算法卷3 深度学习和神经网络

深度学习-图神经网络实战

深度学习与神经网络入门

近期资讯

小米SU7订车半年未交车！车主在线投诉，怎么解？

岚图汽车2025 剑指 20 万销量巅峰，强势崛起引领新能源浪潮

工程机械智能控制器 SPC-FFMC-Y1620

长安CS75 PLUS Ultra正式上市，售13.19万起

比亚迪突然宣布，无图城市领航全国开通，智驾市场格局要变天！

四川凉山彝族车位引导解决方案、停车诱导系统、空闲泊位导航

盘点宝马原地打方向盘异响的通病

奔腾B70黑骑士上市，售价12.09-12.38万元

中东市场新突破！京能新能源第17届阿联酋贸易博览会受热捧

售6.99万元起，奇瑞瑞虎5x 高能版上市

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响