当前位置：首页|资讯|通义千问|大语言模型

小记一下在wenda上使用量化的通义千问（qwen-7b-chat）

作者：传说中的L哥发布时间：2023-08-12

通义千问大语言模型

前几天阿里发布了他们的开源大语言模型通义千问（qwen），根据介绍，这个模型不仅在多项评分中排名靠前，而且支持长对话、对api使用能力也有较大进步。而闻达作为一个LLM调用平台，就十分适合qwen。

wenda其实可以直接运行未量化的通义千问qwen-7b模型，只是速度实在感人。每秒只能生成0.2字，难称可用。

究其原因，通过电脑性能监测发现，运行的时候，不仅调用了外接的显卡（跑LLM的主力，12g显存）还同时调用的内置显卡（1650，凑数的，我是笔记本外接显卡）同时cpu也有负荷。推测是自动进行了多卡推理，但是巨大的性能差异和雷电3的小水管严重拖慢了速度。于是进行int8（只有10g多的显存占用）量化运行

首先说一下，这里面的坑还挺多的，但是也没那么多。简简单单就能搞定。

首先量化，我懒，找的别人在h站上量化好的，感谢发布者的工作。链接：https://huggingface.co/AironHeart/Qwen-7B-Chat-8bit

然后，一定仔细看qwen-7b的readme，你遇到的全部问题里面都记录了，给个好评。然后记得遇到缺啥就安装啥，除了bitsandbytes。

首先在环境中安装必要组件

这只是能保证可用，想能用（18g显存以下的），就得量化。

readme中参考

完成int8的配置

之后不出意外，会提示缺少bitsandbytes，这时候一定要注意版本，Windows需要特定版本才能运行。

我用的这个：

安装完成后就可用正常运行了。这个就是成功的标志

另外发现一个有意思的现象，运行qwen时候，显卡功耗非常低，180w tdp只能跑到24w，速度每秒2字。看项目反馈，有人是提到运行速度慢的问题，目前qwen项目人员也在找问题所在。希望可以找到提高速度的方法。(超长对话显存会来到11g多，长对话时还是要注意)

qwen-7b感觉比glm2-6b聪明点，但是我问的问题不多，实际上差别不大，还需要进一步测试

（顺带一提，问通义千问网页版的时候的回答错的离谱）

我遇到的坑：readme中是max_memory = max_memory忘改，直接pip install bitsandbytes-windows，其他的记不清了

推荐体验

相关资讯

通义千问Qwen-72B-Chat大模型在PAI平台的微调实践

通义千问-72B（Qwen-72B）是阿里云研发的通义千问大模型系列的720亿参数规模的大语言模型，在2023年11月正式开源。

通义千问大语言模型

阿里云大数据AI技术 2024-01-10

阿里通义千问Qwen-7b运行在FastChat

如何让阿里通义千问Qwen-7b运行在FastChat提前准备：FastChat项目地址: git clone https://github.com/lm-sys/FastChat.gitQwen-7B模型：https://huggingface.co/Qwen/Qwen-7B本人环境介绍：显卡：3090 24G内存：60GCPU：AMD-R5 5600系统：Ubuntu22.10Python依赖环境： Miniconda 下载地址：https://mirrors.tuna.tsinghua.edu.cn

通义千问 GitHub Hugging Face

All-In-One 2023-08-20

通义千问Qwen-72B-Chat基于PAI的低代码微调部署实践

通义千问-72B（Qwen-72B）是阿里云研发的通义千问大模型系列的720亿参数规模模型。本文将以 Qwen-72B-Chat 为例，介绍如何通过PAI平台的快速开始（PAI-QuickStart）

通义千问编程

阿里云大数据AI技术 2024-01-11

跨设备运行小小阿里云通义千问大模型 Qwen1.5-0.5B-Chat

Qwen1.5-0.5B-Chat[1]，是阿里云开发的基于大量数据预训练的 transformer 模型，是 Qwen 2 的测试版。此次发布的 1.5 版本的模型在聊天模型、多语言支持方面进行了改进，并且为所有大小的模型都提供了 32K 上下文长度的稳定支持。该模型专为文本生成设计，可用于后训练和持续预训练等任务。Qwen 团队此次共发布了6种不同参数的模型，包括 0.5B[2]、1.8B[3]、4B[4]、7B[5]、14B[6] 和72B。本文中，以Qwen1.5-0.5B-Chat为例，我们将介

Second_State 2024-02-26

无需环境配置，阿里通义千问-7B-Chat本地一键体验

无需环境配置，阿里通义千问-7B-Chat本地一键体验介绍（Introduction）通义千问-7B（Qwen-7B）是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。同时，在Qwen-7B的基础上，我们使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。学术Fun将上述工具制作成一键启动包，点击即可使用，避免大家配置Py

通义千问大语言模型编程

学术Fun 2023-08-04

近期资讯

Win11 右键菜单愈发臃肿：新增“用画图编辑”选项

IT之家11月7日消息，微软三年前推出Windows11时，曾表示重新设计的右键菜单可简化用户体验，但微软现在似乎正在逐渐偏离“简化”的初衷。

IT之家 2024-11-07

长虹旗下e-Flash放疗设备通过型检填补国内空白将进入临床试验

11月7日，在第十二届中国（绵阳）科技城科技博览会（以下简称“科博会”）上，长虹控股集团旗下中玖闪光医疗科技有限公司（以下简称“中玖闪光”）正式展示e-Flash新一代放疗设备。据证券时报·e公司记者了解到，中玖闪光自主研发的e-Flash放疗设备已成功通过型式检验，即将进入临床试验阶段。

证券时报 2024-11-07

处理器和内存成本攀升国产手机迎来一波集体涨价

近段时间，国产手机厂商的旗舰手机迎来一波集体涨价。据《经济观察报》报道，10月30日，荣耀发布Magic7系列手机，12GB+256GB版本的起售价为4499元，比上一代产品的起售价涨了100元。此前一天，小米15系列手机的售价发布，12GB+256GB版本的起售价为4499元，比上一代同样内存版本的价格涨了200元。

每日经济新闻 2024-11-07

Vistra与Hyperscalers（亚马逊AWS、微软Azure、谷歌云平台GCP等涉及人工智能（AI）数据中心的超级耗电大

Vistra与Hyperscalers（亚马逊AWS、微软Azure、谷歌云平台GCP等涉及人工智能（AI）数据中心的超级耗电大户）洽谈升级（若干座/处）核电站。

华尔街见闻 2024-11-07

国行PS5净彩色系外设配件今日发售手柄定价599元

11月7日，PlayStation中国宣布国行PS5轻薄款净彩色系主机盖和手柄今日正式发售，建议零售价分别为469元和599元，共包含三款配色：净彩珠白、净彩靛青和净彩凫绿，其中净彩珠白与净彩靛青在今日率先发售，净彩凫绿发售日期待定。

3DM游戏 2024-11-07

京东闪电新品COLMO北极星洗护套装C2卖爆单日销量超2600台

近日，COLMO北极星洗护套装C2京东小魔方新品日活动圆满收官。京东根据丰富的推新经验总结出了“新品打新六步诀”，并依此助力了众多闪电新品成功实现首发即卖爆。这款产品有全新AI轻干洗技术加持，可智能调控软蒸汽的温度，通过巨量软蒸汽瞬时带走灰尘、螨虫、细菌及气味分子，深入抚平纤维毛糙，除皱不伤衣。

中国财富网 2024-11-07

沈昌祥院士：安全可信保障是发展人工智能的前提

中新网广州11月7日电(记者程景伟)2024大湾区网络安全大会暨第二十六期花城院士科技会议7日在广州开幕。中国工程院院士沈昌祥以《自主可信计算筑牢人工智能安全底座》为题作主题分享，系统论述了可信计算技术在保障大数据、人工智能健康发展的重要作用。“安全可信保障是发展人工智能的前提。”

中国新闻网 2024-11-07

冲刺四季度！成都这家企业月出货量3万至4万台

蜂鸟智造(成都)科技有限公司(下称“蜂鸟智造”)董事长田勇介绍。11月7日，红星新闻记者走进蜂鸟智造的生产车间里，14条中试组装测试线忙碌运转，来自医疗器械、智慧停车、商用服务机器人、消费电子等领域的科研项目“跑”完走向产业化的最后一程……蜂鸟智造正在全力冲刺全年目标。

红星新闻 2024-11-07

网易企业邮箱免费版容量锐减2/3！超出后无法正常收发邮件

快科技11月7日消息，据媒体报道，网易企业邮箱免费版用户的账号容量，已由原来的3GB缩减至1GB，超出容量后将无法正常接收和发送邮件。网易企业邮箱免费版原本提供每个子邮箱账号3GB的数据存储空间，对于常规使用来说基本足够。然而缩减至1GB后，如果用户平常邮件比较多的话，那就需要更频繁地清理邮件及其附件，以避免账号容量被迅速填满。

快科技 2024-11-07

独家首测：全新 Mac mini 的 Type-C 接口能供电了？实测后，我们发现了苹果的秘密

全新Macmini即将在明天开售，这台史上最小的苹果电脑主机，个头不大，来头却不小。为了搞清这次「官网乌龙」事件，爱范儿第一时间拿到了MacminiM4Pro，并在制糖工厂的明日实验室，用专业的仪器和软件，进行了详细测试。

爱范儿 2024-11-07

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1