大模型微调实战（八）-使用INT8/FP4/NF4微调大模型

作者：吃果冻不吐果冻皮发布时间：2023-12-05

ChatGPT

随着，ChatGPT 迅速爆火，引发了大模型的时代变革。然而对于普通大众来说，进行大模型的预训练或者全量微调遥不可及。由此，催生了各种参数高效微调技术，让科研人员或者普通开发者有机会尝试微调大模型。...【查看原文】

相关资讯

大模型微调实战（七）-基于LoRA微调多模态大模型

随着，ChatGPT 迅速爆火，引发了大模型的时代变革。然而对于普通大众来说，进行大模型的预训练或者全量微调遥不可及。由此，催生了各种参数高效微调技术，让科研人员或者普通开发者有机会尝试微调大模型。

LoRA ChatGPT

吃果冻不吐果冻皮 2023-12-04

阿里发布通义千问大模型的int8版本

可在线运行的notebook链接：在kaggle网站搜索：Qwen-7B-Chat-Int8首先需要安装依赖包：!pip install modelscope tiktoken transformers_stream_generator!pip install auto-gptq optimum接着加载八比特量化的模型：from modelscope import AutoTokenizer, AutoModelForCausalLMtokenizer = AutoTokenizer.from_pretr

通义千问

AI日日新 2023-10-18

近期资讯

六足机器人打完冰壶还要登月六条腿为什么能更强？

今年我们看到了很多“机器狗”的新闻，比如在珠海航展上，“机器狗”搭载各种作战装备变成了“战狼”，还有一只山东的“机器狗”驮着物资往泰山上运。

环球时报新媒体 2024-12-29

【实探】华为手机，大降价！

12月29日，中国证券报·中证金牛座记者在华为旗舰店实探发现，近期，华为Pura70系列、MateX5等多款手机开启降价促销优惠。

中国证券报 2024-12-29

AMD RX 9070 XT功耗超过300W！但拒绝16针供电

快科技12月29日消息，AMD的新一代显卡RX9070XT、RX9070将会在CES2025期间正式发布，预计1月底春节前就会上市，更多曝料也不断出现。不过在NVIDIA全线普及12V-2x616针供电接口的情况下，AMD并不会跟进，而是继续使用传统的PCIe8针接口，预计公版标配两个(最大供电能力就有375W)，非公版上三个也不罕见。

驱动之家 2024-12-29

如何找回删除的微信聊天记录及预防措施总结

在我们的日常生活中，微信已经成为了沟通的主要工具。无论是和朋友聊天，还是和家人联系，微信都扮演着重要的角色。然而，有时候我们可能会不小心删除了一些重要的聊天记录，或者因为手机故障、误操作等原因导致聊天记录丢失。这时候，很多人就会想，微信聊天记录删除了怎么找回呢？今天就来聊聊这个话题。

新报观察 2024-12-29

这家科创板公司成为宇树科技合作伙伴

《科创板日报》记者从道通科技获悉，道通科技及全资子公司深圳市道和通泰机器人有限公司与某头部创新机器人公司签订《战略合作协议》，确认未来双方将在联合研发和推广空地一体集群智慧解决方案上展开合作。

金融界 2024-12-29

华为官宣：奖金300万元！

奥林帕斯奖奖金100万元人民币（含税）/个，奥林帕斯先锋奖20万元人民币（含税）/个，合计300万元。

中国基金报 2024-12-29

财富自由涨粉百万，初代网红选择扎堆翻红

在互联网世界快速发展的今天，不知道你有没有好奇过那些初代网红的现状如何呢？大冰是谁？要爆炸头？还是要猪脚饭？留几手，原名刘爽。

砍柴网 2024-12-29

过去十年，网上流行的这些“科学”流言，你中招了吗？

二维码很快就会被用完、基因检测能够剧透智商、新能源汽车辐射很强……这些在网上流传的所谓“科学道理”，你是否还在深信不疑？12月29日，记者从北京市科协获悉，“智止流言探求真知”——“科学”流言求真榜十周年发布活动举行，邀请专家为公众梳理并粉碎过去十年在网络上广为传播的十大“科学”流言，帮助公众明辨是非。

新京报 2024-12-29

迈瑞医疗与腾讯联合发布启元重症大模型

联合发布了全球首个重症医疗大模型——「启元重症大模型」，这一创新工具旨在通过人工智能技术减轻ICU医生的负担，并提高抢救效率。启元重症大模型能够高效处理病情数据，接管文书工作，使医生能够更专注于治疗和抢救工作。基于对临床工作痛点的深入了解，其精准聚焦临床实践中的多元需求，打造出四大功能——重症知识查询、病情问答、建议生成、病例撰写。

动点科技 2024-12-29

95后AI“天才少女”刷屏！雷军千万年薪挖角！

她曾在DeepSeek参与了DeepSeek-V2的研发，是这款模型的关键开发者之一。在DeepSeek-V3发布前几天，媒体报道称小米创始人雷军已开出千万年薪，将罗福莉招至麾下，罗福莉将就职于小米AI实验室，领导大模型团队。

证券时报 2024-12-29

大模型微调实战（八）-使用INT8/FP4/NF4微调大模型

推荐体验

相关资讯

大模型微调实战（七）-基于LoRA微调多模态大模型

阿里发布通义千问大模型的int8版本

贪心大模型微调实战营

贪心大模型微调实战营贪心大模型开发应用实战营贪心大模型微调实战营算法篇分享

贪心AI大模型实战开发微调大模型学习

近期资讯

六足机器人打完冰壶还要登月六条腿为什么能更强？

【实探】华为手机，大降价！

AMD RX 9070 XT功耗超过300W！但拒绝16针供电

如何找回删除的微信聊天记录及预防措施总结

这家科创板公司成为宇树科技合作伙伴

华为官宣：奖金300万元！

财富自由涨粉百万，初代网红选择扎堆翻红

过去十年，网上流行的这些“科学”流言，你中招了吗？

迈瑞医疗与腾讯联合发布启元重症大模型

95后AI“天才少女”刷屏！雷军千万年薪挖角！

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响