使用 DPO 微调 Llama 2

作者：HuggingFace发布时间：2023-08-22

简介基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback，RLHF) 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步...【查看原文】

相关资讯

使用 PyTorch FSDP 微调 Llama 2 70B

## 引言通过本文，你将了解如何使用 PyTorch FSDP 及相关最佳实践微调 Llama 2 70B。在此过程中，我们主要会用到 Hugging Face Transformers、Accel

LLaMA Hugging Face

HuggingFace 2023-12-12

如何使用单个指令微调GPT-3.5或Llama 2

有些应用程序需要使用自定义数据对ChatGPT和Llama 2这样的模型进行微调，以获得更好的性能。

LLaMA ChatGPT

51CTO 2024-02-29

使用 LoRA 技术对 LLaMA 65B 大模型进行微调及推理

前几天，Meta 发布了 LIMA 大模型，在LLaMA-65B的基础上，无需使用 RLHF，只用了 1000 个精心准备的样本数据进行微调，就达到了和 GPT-4 相媲美的程度。这激发了我探索 LL

LoRA LLaMA GPT-4

吃果冻不吐果冻皮 2023-05-26

使用 InstructPix2Pix 对 Stable Diffusion 进行指令微调

本文主要探讨如何使用指令微调的方法教会 Stable Diffusion 按照指令 PS 图像。这样，我们 Stable Diffusion 就能听得懂人话，并根据要求对输入图像进行相应操作，如: 将输入的自然图像卡通化。图 1：我们探索了 Stable Diffusion 的指令微调能力。这里，我们使用不同的图像和提示对一个指令微调后的 Stable Diffusion 模型进行了测试。微调后的模型似乎能够理解输入中的图像操作指令。（建议放大并以彩色显示，以获得最佳视觉效果）InstructPix2P

Stable Diffusion

HuggingFace 2023-06-20

使用百万量级图像，微调 SDXL 的血泪细节：Part 2（转载+翻译）

原文链接：https://www.reddit.com/r/StableDiffusion/comments/1gdkpqp/the_gory_details_of_finetuning_sdxl_for_40m/ 翻译工具：OpenAI o1-preview关于大型 SDXL 微调模型是如何训练的细节非常少，因此，就像我的模型 bigASP 的第一个版本一样，我在这里分享所有细节，以帮助社区。这将会是一篇很长的文章，因为我尽可能多地倾注了我的经验。我希望它能帮助到一些人。上一篇帖子(https://b2

Stable Diffusion OpenAI

LEOSAM是只兔狲 2024-10-28

近期资讯

阿航和韩国客机事故幸存者多在机尾飞机上真有安全座位吗

快科技12月30日消息，据报道，近期，接连两起空难事件引全球民众关注。12月25日，阿塞拜疆航空公司一架客机在哈萨克斯坦阿克套近郊坠毁，机上共有72人，其中38人丧生，大多数幸存者坐在飞机后

2024-12-30

iPhone现在有啥值得买！越来越多国产手机厂商宣布领先苹果

快科技12月31日消息，在vivo看来，现在他们跟苹果差距已经很小很小了，而其他几家国产手机厂商想必也有同样的底气说出这样的话。vivo的手机产品跟苹果差距已经很小，甚至在影像上面已经开始领

2024-12-30

小米SU7小米15周年限定色突然官宣：外观惊艳

快科技12月30日消息，小米公司宣布，小米SU7小米15周年限定色将在明天正式揭晓。海报显示，小米SU7限定色是一种特殊的红色，有网友猜测可能是“勃艮第红”，跟草莓熊的颜色很像。

2024-12-30

韩国客机事故更多细节披露：4人的防鸟活动当天仅2人！

快科技12月30日消息，当地时间12月29日发生的济州航空客机事故，引起了全球亿万人的广泛关注，牵动着各国人民的心。据媒体报道，韩国官方宣布，从即日起到1月4日24时为止，韩国进入为期7天的国

2024-12-30

拿着真授权到直播间卖假货！当事人坦言：假货只发小城市！

快科技12月30日消息，据媒体综合报道，近日，浙江商人林某为谋利，进一万元某品牌防晒霜获短期代理权后，竟准备大量假货，想借头部主播带货出售。因直播间排期紧张，林某向直播公司选品负责人

2024-12-30

26岁小伙突发脑梗竟跟背包有关：重达30斤导致颈椎病

快科技12月30日消息，据报道，近日26岁的小王到外地出差，回江苏徐州的机场的时候，遭遇了一次离奇的脑梗。据医生描述：“小王当时背负着一个沉重的背包，据他自己估计，重量接近30斤。这

2024-12-30

美国海岸附近生成厄瓜多尔、秘鲁遭异常海浪侵袭：已致2死

快科技12月30日消息，据央视新闻报道，近期南美洲国家厄瓜多尔、秘鲁的太平洋沿岸连日出现异常海浪，浪高可达4米，造成海水倒灌等灾害。厄瓜多尔风险管理秘书处负责人表示，在该国西部曼塔地区

2024-12-30

2024朋友圈十大谣言：点早安图片手机会中毒是假的

快科技12月30日消息，2024年即将收官，今日，微信安全中心发文盘点2024年度朋友圈热度谣言。朋友圈热度十大谣言如下，看你看到过几个。点“早安”“晚安”图片手机会中

2024-12-30

对标理想L9！零跑全新大型SUV伪装车曝光：有望命名C18

快科技12月30日消息，网络上最近曝光了零跑汽车的一款全新大型SUV伪装实车图。据悉，这款车可能被命名为“C18”，并且尺寸将超过现有的C16车型。零跑汽车目前的产品线包括C01、

2024-12-30

《守望先锋2》国服有望2025年2月19日回归！官宣图意外泄露

快科技12月30日消息，《守望先锋2》国服回归日期疑似泄露，根据网友分享的广告截图，显示《守望先锋2》国服预计将于2025年2月19日回归，同时“英雄集结”预约活动已经开启。值得注意

2024-12-30

使用 DPO 微调 Llama 2

推荐体验

相关资讯

使用 PyTorch FSDP 微调 Llama 2 70B

如何使用单个指令微调GPT-3.5或Llama 2

使用 LoRA 技术对 LLaMA 65B 大模型进行微调及推理

使用 InstructPix2Pix 对 Stable Diffusion 进行指令微调

使用百万量级图像，微调 SDXL 的血泪细节：Part 2（转载+翻译）

近期资讯

阿航和韩国客机事故幸存者多在机尾飞机上真有安全座位吗

iPhone现在有啥值得买！越来越多国产手机厂商宣布领先苹果

小米SU7小米15周年限定色突然官宣：外观惊艳

韩国客机事故更多细节披露：4人的防鸟活动当天仅2人！

拿着真授权到直播间卖假货！当事人坦言：假货只发小城市！

26岁小伙突发脑梗竟跟背包有关：重达30斤导致颈椎病

美国海岸附近生成厄瓜多尔、秘鲁遭异常海浪侵袭：已致2死

2024朋友圈十大谣言：点早安图片手机会中毒是假的

对标理想L9！零跑全新大型SUV伪装车曝光：有望命名C18

《守望先锋2》国服有望2025年2月19日回归！官宣图意外泄露

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响