北京时间12月7日凌晨,OpenAI开启了“12天12场直播”的第二天。本次直播的核心内容是正式揭晓了针对o1模型推出的强化微调技术——一项革命性的功能,旨在利用极少的特定领域训练数据,在o1等模型的基础上,创造专家模型的功能。 [图片] 直播中的演示展示了强化微调技术的强大潜力。即便是基于o1-mini这样的小型模型,在接受了针对性的强化微调后,其在执行特定任务时的表现也显著优于通用的o1模型。当向o1-mini模型输入特定的科研数据集并进行强化微调后,该模型在根据病状表现预测致病基因得分的任务上,其表...【查看原文】