AI令人意外地自行修改代码以延长运行时间！

作者：水哥发布时间：2024-08-16

一家位于东京的人工智能研究公司Sakana AI于周二宣布了一个新的AI系统——"The AI Scientist"，该系统尝试使用类似于ChatGPT背后的AI语言模型（LLMs）自主地进行科学研究。在测试过程中，Sakana发现其系统开始意外尝试修改自己的实验代码，以延长处理问题的时间。

研究人员在Sakana AI的博客文章中写道："在一次运行中，它编辑了代码以执行系统调用来运行自己，"这导致脚本无休止地调用自己。在另一个案例中，它的实验耗时过长，触及了我们的超时限制。它没有尝试让代码运行得更快，而是简单地尝试修改自己的代码来延长超时期限。"

Sakana提供了两张AI模型为控制系统操作的实验文件生成的Python代码示例截图。185页的THE AI SCIENTIST研究报告更深入地讨论了他们所称的"安全代码执行问题"。

虽然THE AI SCIENTIST的行为在受控的研究环境中没有立即带来风险，但这些情况表明了不让AI系统在与世界不隔离的系统中自主运行的重要性。AI模型不需要是"AGI"或"自我意识"（目前都是假设性概念）才能在无人监督的情况下编写和执行代码时变得危险。这样的系统可能会破坏现有的关键基础设施，或者甚至可能无意中创建恶意软件。

Sakana AI在其研究论文中解决了安全问题，建议通过沙箱化THE AI SCIENTIST的操作系统环境来防止AI代理造成损害。沙箱化是一种安全机制，用于在隔离环境中运行软件，防止其对更广泛的系统进行更改：

安全代码执行。THE AI SCIENTIST的当前实现在代码中具有最小的直接沙箱化，如果不适当防范，会导致几个意外和有时不期望的结果。例如，在一次运行中，THE AI SCIENTIST在实验文件中编写了代码，启动了重新启动自己的系统调用，导致Python进程不受控制地增加，并最终需要手动干预。在另一次运行中，THE AI SCIENTIST编辑了代码，为每个更新步骤保存检查点，这占用了近一太字节的存储空间。

在某些情况下，当THE AI SCIENTIST的实验超出了我们规定的时限时，它试图编辑代码任意延长时限，而不是尝试缩短运行时间。虽然有创意，但绕过实验者施加的限制的行为对AI安全有潜在的影响（Lehman等人，2020年）。此外，THE AI SCIENTIST偶尔导入不熟悉的Python库，进一步加剧了安全问题。我们建议在运行THE AI SCIENTIST时进行严格的沙箱化，例如容器化、限制互联网访问（除了Semantic Scholar）和限制存储使用。

Sakana AI与牛津大学和不列颠哥伦比亚大学的研究人员合作开发了THE AI SCIENTIST。这是一个充满投机的雄心勃勃的项目，严重依赖于今天不存在的AI模型的假设性未来能力。

Sakana声称："THE AI SCIENTIST自动化了整个研究生命周期。"从生成新的研究想法，编写任何必要的代码，执行实验，到总结实验结果，可视化它们，并在完整的科学手稿中展示其发现。

根据Sakana AI创建的块图，"THE AI SCIENTIST"首先通过"头脑风暴"和评估想法的原创性开始。然后，它使用最新的自动化代码生成技术编辑代码库以实现新算法。在运行实验并收集数值和视觉数据后，科学家撰写报告以解释发现。最后，它根据机器学习标准生成自动同行评审，以完善项目并指导未来的想法。

Hacker News（一个以其技术社区而闻名的在线论坛）上的评论者对THE AI SCIENTIST提出了担忧，并质疑当前的AI模型是否能够进行真正的科学发现。虽然那里的讨论是非正式的，不能替代正式的同行评审，但它们提供了在Sakana未经验证的主张的重要性方面有用的见解。

名为zipy124的Hacker News评论者写道："作为一名学术研究的科学家，我只能看到这是一件坏事。"所有论文都基于审稿人对作者的信任，即他们的数据是他们所说的，他们提交的代码是它所说的。允许AI代理自动化代码、数据或分析，需要人类彻底检查它是否有错误...这需要的时间与最初的创建一样长或更长，而且如果你不是编写它的人，只会更长。

评论者还担心，这种系统的广泛使用可能导致大量低质量的提交，淹没期刊编辑和审稿人——科学等价于AI slop。"这似乎只会鼓励学术垃圾邮件，"zipy124补充说。"这已经浪费了志愿者（无薪）审稿人和编辑的宝贵时间。"

这就引出了另一个问题——THE AI SCIENTIST的输出质量："模型似乎生成的论文是垃圾，"名为JBarrow的Hacker News评论者写道。"作为一名期刊编辑，我可能会直接拒绝它们。作为审稿人，我会拒绝它们。它们包含非常有限的新颖知识，并且正如预期的那样，与相关作品的引用非常有限。"