当前位置：首页|资讯

基于华为昇腾910B，实战 InternLM2.5-7B-Chat 模型推理

作者：OpenMMLab发布时间：2024-10-16

本文将带领大家基于启智平台，使用 LMDeploy 推理框架在华为昇腾 910B 上实现 internlm2_5-7b-chat 模型的推理。

https://github.com/InternLM/lmdeploy（欢迎star）

https://github.com/InternLM/InternLM（欢迎star）

1.登录启智平台

https://openi.pcl.ac.cn/

2.创建云脑任务

新建云脑任务

目前启智平台提供 4 种 AI 训练任务（调试任务、训练任务、在线推理、通用任务），这里我们选择调试任务。

所属项目，我们选择一个已经有的项目，没有项目，可以新建，这个就不详细展开。（可以点击右上角）

接下来就是选择算力平台，启智平台目前提供了好几个厂商的算力。（英伟达、昇腾NPU、遂源GCU、寒武纪MLU、海光DCU、天数智芯GPGPU、沐曦GPGPU) ，这里我们选华为昇腾NPU。

资源规格栏，我们选择 D910B 的显卡。（显存 64GB 、CPU24 、内存 192GB）

镜像栏会随着选择的显卡出现相应的模型镜像，这里我们选择 openmind_cann8。

模型这块我们可以根据自己的需要选择。考虑到 LMDeploy 并不是每个模型都是支持的，我们在官方的列表中找到支持的模型 https://lmdeploy.readthedocs.io/en/latest/supported_models/supported_models.html

这里我们选择 internlm2_5-7b-chat 模型，

模型选择后，回到新建模型列表页面，点击新建任务等待服务器创建新任务。

当分配资源完成后，状态变成运行状态，这个时候右边操作会出现调试按钮。

3.模型调试

我们点击调试按钮，进入 jupyterlab 调试代码界面。

3.1 检查挂载模型

这个时候模型挂载在哪个目录下呢？我们使用启智平台提供的 c2net 库访问方式，可以在启动界面找到挂载模型路径。

我们同样也可以在 jupyterlab 界面编写下载模型代码脚本。

start.sh

zz.py

我们可以将脚本和代码上传到 jupyterlab 调试界面里面。

分别执行这 2 段脚本和代码。先执行 start.sh，后执行 zz.py。

bash start.sh

再执行 zz.py

python zz.py

刷新一下当前目录，我们会看到左边代码区 code、dataset、output、pretrainmodel 4 个文件夹。顾名思义，code 是放代码的；dataset 放数据集的；output 模型训练或者微调输出目录；pretrainmodel 就是模型挂载的目录。我们进入 pretrainmodel ：

可以看到，模型已经挂载到上面截图的目录了。

3.2 支持华为 ascend 国产硬件接入大模型推理框架 dlinfer

这里我们借助一下开源项目 dlinfer，项目地址：https://github.com/DeepLink-org/dlinfer

目前它支持 LMDeploy 部分模型推理，见下表：

安装参考：https://pypi.org/project/dlinfer-ascend/

3.3 LMDeploy 推理框架安装

接下来我们需要再 code 代码目录下面下载 LMDeploy 推理程序并安装。安装之前我们需要下载 LMDeploy 源码，

源码中需要删除 LMDeploy 推理框架中 requirements/runtime.txt 中关于 triton 依赖包。

因为 Triton 是 NVIDIA 推出的一款开源推理服务软件，旨在简化深度学习模型在生产环境中的部署和执行。它属于 NVIDIA AI 平台的一部分，能够在基于 GPU 或 CPU 的基础设施（如云、数据中心或边缘设备）上运行。我们在华为平台上部署也用不到它。（如果你安装大概率你是安装不上的，不信你试一试。）

我们修改 requirements/runtime.txt：

如果网络慢可以使用下面的代理：

检查一下 LMDeploy：

3.4 LMDeploy 推理

接下来我们编写推理代码实现模型推理

inference.py

执行推理代码

我们查看一下显存情况：

我们使用 lmdeploy chat 来推理：

我们输入问题测试下推理效果：

4.总结

LMDeploy 在 0.6.0 这个版本上开始支持华为昇腾NPU。不过官方的文档只包含了 docker 镜像推理的示例，对于非 docker 镜像如何部署安装没有提到，这样对平台的移植性就变差了。

好在启智平台提供了华为的昇腾NPU 运行环境，不过这里我们需要注意：虽然启智平台提供了华为的昇腾 NPU 运行环境，但是不是每个镜像都能很顺利地跑完，我花了些时间进行测试，结果发现大部分镜像是不能运行的。

下面表格列出了我测试下来的情况，贴出来供大家参考：

致谢

最后要特别感谢启智平台提供免费的算力，还要感谢书生大模型实战营的学友 JeffDing（微信名）提供的文档思路。

推荐体验

相关资讯

大模型国产化适配6-基于昇腾910B快速验证ChatGLM3-6B/BaiChuan2-7B模型推理

随着 ChatGPT 的现象级走红，引领了AI大模型时代的变革，从而导致 AI 算力日益紧缺。与此同时，中美贸易战以及美国对华进行AI芯片相关的制裁导致 AI 算力的国产化适配势在必行。之前也分享过一

ChatGPT AI大模型 AI芯片

吃果冻不吐果冻皮 2024-01-14

大模型国产化适配10-快速迁移大模型到昇腾910B保姆级教程（Pytorch版）

随着 ChatGPT 的现象级走红，引领了AI大模型时代的变革，从而导致 AI 算力日益紧缺。与此同时，中美

ChatGPT AI大模型

吃果冻不吐果冻皮 2024-06-02

InternLM2.5-20B-Chat 正式上线 SiliconCloud 平台

经推理加速的 InternLM2.5-20B-Chat 已正式上线 SiliconCloud 平台。开发者们无需自行开发和部署，直接通过平台就可以轻松调用 API 服务实际应用。API 调用代码：from openai import OpenAIclient = OpenAI(api_key="YOUR_API_KEY", base_url="https://api.siliconflow.cn/v1")response = client.chat.completions.create( model='i

OpenMMLab 2024-08-22

大模型国产化适配3-基于昇腾910使用ChatGLM-6B进行模型训练

随着 ChatGPT 的现象级走红，引领了AI大模型时代的变革，从而导致 AI 算力日益紧缺。与此同时，中美

ChatGLM ChatGPT AI大模型

吃果冻不吐果冻皮 2023-07-18

大模型国产化适配8-基于昇腾MindIE推理工具部署Qwen-72B实战（推理引擎、推理服务化）

随着 ChatGPT 的现象级走红，引领了AI大模型时代的变革，从而导致 AI 算力日益紧缺。与此同时，中美

AI大模型 ChatGPT

吃果冻不吐果冻皮 2024-05-07

近期资讯

飞利浦发布鹅卵石便携剃须刀

10月13日，飞利浦首发男士理容新品——飞利浦鹅卵石便携剃须刀(以下简称“飞利浦鹅卵石”)。飞利浦基于对中国男性胡须生长特点和多场景净剃使用需求，该款产品兼顾“便携”与“净剃”，将亮相即将开幕的第七届进博会。飞利浦方面表示，在接下来的发展里面，继续重视中国市场，为中国消费者的健康考量，长期赋能中国消费者。

北青网 2024-10-13

涉及人工智能、生物医药等多个领域，又一批重点项目落户中原区

10月12日，郑州市中原区三季度招商引资项目集中签约活动在芝麻街1958双创园举办。

河南日报 2024-10-13

荣耀平板 9 Pro 系列获推 MagicOS 8.0.0.218 版本升级

据介绍，荣耀平板9Pro发布于今年4月，搭载天玑8100处理器，提供星空灰、天青色2款配色；配备12.1英寸纸感高刷护眼屏，支持144Hz自适应高刷、2.5K分辨率、10.7亿臻彩显示；搭载八扬声器，拥有4高音+4低音的音频单元，通过“爱优腾”高规格视频播放认证。

IT之家 2024-10-14

SpaceX：发射塔的机械臂成功夹住了返回地面的超级重型火箭“Super Heavy”

钛媒体App10月13日消息，SpaceX表示，发射塔的机械臂成功夹住了返回地面的超级重型火箭“SuperHeavy”。

钛媒体快报 2024-10-13

资深业内人士分析 Switch 2与PS5 Pro哪个更值得买

粉丝期待多时的任天堂Switch下代主机离我们越来越近，而索尼也“高调”的公布了半换代新机PS5Pro，那么作为玩家来说是继续等待Switch2还是高价购买PS5Pro呢？

3DMGAME 2024-10-13

天文学重大突破：詹姆斯·韦伯望远镜发现的神秘蒸汽世界

》上的研究结果中，Raul强调：“现在是投身天文学的最佳时机。”随着科技的发展，未来的望远镜和探测器将会带给我们更多的惊喜。新一代的天文学家可以借助现有的技术与理论，探索更加遥远和未知的宇宙。

来自星星的小胖子 2024-10-13

鄂州职业大学举行虚拟现实技能竞赛

虚拟现实、人人开发，为加快VR技术的普及和应用、培养优秀VR技术技能人才，10月12日，2024“一带一路”暨金砖国家技能发展与技术创新大赛第七届虚拟现实（VR）产品设计与开发决赛开幕式，在鄂州职业大学举行。据悉，来自全国73所院校的94支国内队伍，以及2支国外队伍共计162名国内外参赛选手参加此次比赛。

极目新闻 2024-10-13

首款背插3.0 Z890主板曝光：正面没有一根线！

这两年，背插主板、显卡不断兴起，而随着IntelZ890主板及酷睿Ultra200S处理器的发布，新一代背插3.0主板也来了，第一款来自七彩虹iGame。推动了背插浪潮的博主“远古时代装机猿”隐晦曝光了这款新主板，可以看到它的正面非常简洁，只有四条DDR5DIMM、一条PCIe5.0x16、一条PCIe4.0x4、三个M.2。

驱动之家 2024-10-14

全面了解OpenAI前CTO Mira Murati：AI领域最具影响力女性

鞭牛士报道，10月13日消息，据外电报道，OpenAI前CTOMiraMurati的净资产已成为科技和创新领域许多人关注的话题。她对该领域的贡献，加上她的领导能力，不仅为她赢得了认可，还为她带来了可观的金融投资组合。

鞭牛士 2024-10-13

聊一聊：十月份你最期待啥新机？

差评XPIN 2024-10-14

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1