[图片] 论文:https://arxiv.org/pdf/2401.10020.pdf 研究者们提出了一种创新的模型训练方法,让模型自动生成训练数据,并评估数据质量,然后用这些数据自我训练。? 这一方法让模型在不断的训练中自我改进。 研究结果显示,在AlpacaEval 2.0排行榜上,模型表现超过了Claude 2、Gemini Pro和GPT-4 0613等。 具体步骤:起步: 从一个已经训练好的语言模型开始,并准备一小部分由人类标注的初始训练数据。自主生成指导: 模型创造新的提示(问题或指令...【查看原文】