像文心一言4.0等是通用大模型,而不是行业大模型。
各行各业有自己的数据集和个性化需求。可以在通用基座大模型的基础上,用自己的数据集(数据集可以很小,几百条也可以)精调训练。把基座大模型的知识和能力,迁移泛化到我们自己的领域。
让最前沿的AI大模型,赋能你的行业和专业。
百度智能云千帆modelbuilder模型,主要步骤有:整理数据集,SFT模型精调,在线测试,模型评估,公有云部署,API调用
https://console.bce.baidu.com/
数据类型选择:Prompt+Response(一问一答类型)
整理好需要训练的数据集后,进行本地导入上传至平台。
数据量越多,训练效果越好
Post-pretrain:适合数据量大,预算充足的场景。10亿token级别的高质量行业语料库。即行业大模型。
SFT:问答对,小数据集训练一个助手
RLHF:强化学习的方法,利用人类反馈信号直接优化语言模型,即训练chatgpt的技巧。需要大量的人工反馈。
ERNIE Speed:百度文心大模型家族2024年新成员,高速度,高性能
全量更新:微调大模型的全部参数,适合数据量比较大,和基座模型差异大的专业领域
lora:保留原始权重矩阵,只更新低秩分解后的参数。适合数据量小,和基座模型差异小的通用领域。
lora
迭代轮次0-50
学习率,最低0.00003
加载自己的预训练数据集
基座模型,迭代轮次都会影响预估费用
根据参数提示,可查看训练的质量如何。
选择训练的模型,进行对话测试