最近一直做的 txt2sql 的项目,但使用的大模型的是通义千问 api 接口,领导在充了 2000 块之后觉得太贵了,让我开始研究能不能微调下开源 codellama 来替换通义千问,所以才有了下文...【查看原文】
用AI生成的指令微调羊驼大模型,数学能力超ChatGPT——微软最新开源大模型WizardMath来了。如下图所示,经过GSM8k数据集测试,WizardMath数学能力直接击败了ChatGPT、Claude In
ChatGPTClaude微软
2023-08-14
## 引言 通过本文,你将了解如何使用 PyTorch FSDP 及相关最佳实践微调 Llama 2 70B。在此过程中,我们主要会用到 Hugging Face Transformers、Accel
LLaMAHugging Face
HuggingFace 2023-12-12
GitHub 4.8k星
ChatGPTGitHub微软
量子位 2023-08-14
火遍硅谷、OpenAI重金押注的人形机器人Figure01,现在会看会听,能和人类自由对话了。当地时
OpenAI
硅星人 2024-03-14
百度: https://pan.baidu.com/s/1OyByAVBBF1qQH46fMt0wXA?pwd=ct3z夸克:https://pan.quark.cn/s/3c93b3a1b9c3不支持A卡至少22G显存解压后4个文件夹,eval_config和minigpt4下面是配置文件, ck和vicuna13b是模型文件,全部覆盖即可,记得备份配置文件。效果当然比7B好
GPT-4百度
独立研究员-星空 2023-05-03
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1