在面对资源分配、实验设计、任务调度或在众多选择中选择最有效的路径时,采用机器学习+运筹优化的策略,可以快速找到最优或接近最优的解决方案,帮助我们做出决策。
这种策略实际上是一种强大的工具组合,可以让决策更智能、优化更高效。作为近几年数据科学和人工智能领域的一个重要研究方向,它不仅加快了计算速度,还能挖掘出隐藏的价值,让优化结果更准确、更有用。无论是制造、城市管理还是金融,都非常适用。
这种融合同时也为我们解决复杂问题提供了新的思路和方法,是如今优化领域的新热点,顶会顶刊都已经发表了不少,比如《Nature Machine Intelligence》的HypOp框架、NIPS的BQ-NCO方法、AAAI的LCH-Regret方法等。
我这次就帮同学们整理了9篇机器学习+运筹优化的最新论文,代码基本都开源了,方便大家复现找灵感。
扫码添加小享,回复“机器运筹”
免费获取全部论文+开源代码
方法:论文提出了一种名为 HypOp 的新框架,旨在解决高维约束组合优化问题。HypOp 利用超图神经网络来处理复杂的约束关系,并通过分布式和并行训练架构提高了算法的可扩展性和效率,适用于多种科学和工程领域的应用。
创新点:
引入基于超图神经网络(HyperGNNs)的参数化变换函数。
提出可扩展的多GPU超图神经网络训练算法,实现了并行和分布式训练,提高了大规模图的训练效率。
通过在不同优化问题上应用预训练模型,探索迁移学习的可能性。
方法:论文探讨了如何利用神经网络解决组合优化问题(COPs),提出了一种新的方法,将COPs建模为马尔可夫决策过程(MDPs),并使用基于Transformer的架构进行策略学习,显著提升了五类问题的泛化性能。
创新点:
提出了一种将任意组合优化问题(COP)表示为马尔可夫决策过程(MDP)的框架,通过利用问题的对称性来提高模型的泛化能力。
引入了基于对称性简化状态空间的“仿真商”方法,尤其适用于递归性质的COP,从而减少状态空间并提高效率。
针对欧几里得路径TSP问题,设计了一种不使用位置编码的Transformer架构,通过稳定的ReZero归一化提高训练效果。
扫码添加小享,回复“机器运筹”
免费获取全部论文+开源代码
方法:论文探讨了基于深度强化学习的神经组合优化(NCO)方法,特别是学习构造启发式(LCH)在解决组合优化问题(COPs)中的应用,提出了一种新的基于遗憾机制的LCH方法,旨在改善解决方案构建过程中的收敛性和网络表示能力。
创新点:
提出了一种简单而强大的LCH-Regret方法,这是首个修改自回归解构过程的方法,显著提升了LCH模型的性能。
LCH-Regret通过改进节点编码,增强了解的构建过程,相较于原始LCH模型取得了更好的结果,尤其是在解码过程中对节点编码的利用上。
方法:论文提出了一种名为 NHDE的新方法,用于解决多目标组合优化(MOCO)问题。NHDE 通过增强多样性来生成更多的帕累托解,它结合了深度强化学习(DRL)和图注意力机制,以提高解决方案的多样性和性能。
创新点:
引入了多帕累托最优(MPO)策略,通过在每个子问题的邻域中寻找多个相关解,而不是仅依赖单一最优解,提高了解的多样性。
采用指标增强的深度强化学习(DRL)方法,结合异构图注意力模型(HGA),以在不同子问题间生成多样化的解。
提出了神经启发式算法(NHDE),将问题分解与综合指标结合,提升了多样性和性能。
扫码添加小享,回复“机器运筹”
免费获取全部论文+开源代码