Qwen 2.5 系列包括从 0.5B 到 110B 参数的模型,针对编程、逻辑推理和自然语言理解等各种任务进行了优化。这些模型包括用于边缘设备的较小模型(0.5B、1.8B、4B、7B、14B)和用于企业用途的较大模型(72B、110B),在指令遵循、逻辑和超过 29 种语言支持方面都有了显著的改进。它们具有长上下文支持(最多 128K 个输入token和超过 8k 个token生成),并且可以生成 JSON 等结构化输出。Qwen 2.5 系列在多模态和音频/视频理解等任务中表现出色。 Qwen2.5...【查看原文】