罗马不是一天建成的:“Rome was not built in a day, but they were laying bricks every hour.” — John Heywood ?论文链接:https://arxiv.org/pdf/2409.02877 ? 简介 ?这篇论文探讨了大型语言模型(LLMs)在计算效率和持续可扩展性方面的挑战,这些挑战主要是由于LLMs对大量参数的需求,使得在计算资源有限的设备上应用这些模型以及在需要多种能力的场景中使用这些模型变得日益复杂。为了解决这些问题,论...【查看原文】