AI大模型本地化部署Q/A本地大模型部署篇

作者：门的耳朵发布时间：2024-03-24

AI大模型

转：NVIDIA 的朋友和我说他们内部一律都是 ubuntu，cuda 生产环境不建议用 debian、ubuntu 之外的任何系统，只会徒增烦恼。

操作系统建议Ubuntu22，长期维护版本。

安装显卡驱动

安装CUDA：

https://developer.nvidia.com/cuda-downloads

如果已经通过图形安装了驱动，千万不要再在此处安装驱动。会出现版本冲突的情况导致驱动无效。

安装Conda

https://conda.io/projects/conda/en/latest/user-guide/install/linux.html

以上安装遇到问题，可以下面网站提问：

https://devv.ai/

安装vllm：

https://docs.vllm.ai/en/latest/getting_started/installation.html

vllm的大吞吐量，是特别适合沉浸式翻译的高并发，体验上会非常舒畅：

重要操作提示

为了确保计算机的稳定性，请在每次开机后执行以下命令，以稳定显卡的功耗。忽视这一步骤可能会导致由于功耗波动过大而引起计算机重启。

执行上述命令后，显卡的功耗将保持在当前状态，从而避免不必要的波动。这有助于提高系统的稳定性，特别是在运行资源密集的推理任务时。

vllm启动参考命令：

正常情况下，不建议开启--enforce-eager，因为会关闭cuda graph：

服务启动后，兼容OpenAI API的软件即可调用该服务的API进行大规模语言模型推理。

相关资讯

AI大模型本地化部署Q/A硬件篇

1. 模型规模与硬件配置硬盘空间的需求取决于你打算部署的模型大小。一般来说，模型越大，所需的硬件资源也越丰富。这里推荐的是Qwen1.5 72B模型，它的中文处理能力可与GPT4相媲美，属于中文大型模型的佼佼者。2. 推荐魔改2080Ti的原因 - 4卡魔改2080Ti可提供88G显存，使用vllm推理框架，Qwen1.5 72B能够处理15k上下文或达到28T/s的速度； - 8卡魔改2080Ti则提供174G显存，在vllm框架下，Qwen1.5 72B能处理30k上下文或达到35T/s的速度。3.

AI大模型 GPT-4

门的耳朵 2024-03-24

还不会部署本地AI大模型？LangChat带你快速接入并部署本地大模型

还不会部署本地AI大模型？使用LangChat带你快速部署并接入本地Ollama AI大模型。LangChat是Java生态下企业级AIGC项目解决方案，在RBAC权限体系的基础上，集成AIGC大模型

AI大模型 AIGC

TyCoding 2024-08-14

手把手ChatGPT私有化本地化部署

随着AI技术的不断成熟，加上ChatGPT如火如荼的发布新版本迭代更新，人工智能的热度也升温到史无前例的高度。我们有理由相信，现在身边还不愿主动去接触这项技术，深入了解的小伙伴，在不久的将来，一定会

ChatGPT 人工智能

springsymphony 2023-03-15

随身wifi安装docker并部署本地化chatGPT

【安装docker环境】1.切换root:sudo -i2. 更新源：sudo apt-get update3. 安装工具：sudo apt-get install curl wget apt-transport-https ca-certificates gnupg2 software-properties-common4. 添加 Docker 的官方 GPG 密钥：curl -fsSL https://mirrors.ustc.edu.cn/docker-ce/linux/debian/gpg |

ChatGPT

移城亦然 2023-05-30

本地部署运行大模型

本文介绍了使用ollama在本地部署大模型，通过本地部署的客户端与大模型交互，并且简单体验了RAG。最后简单介绍了在本地搭建chatgpt 3.5的代理，可以免密钥的方式访问openai的api。

ChatGPT OpenAI

小豪11 2024-04-19

近期资讯

热潮继续，中国市场2024运动鞋服行业的6点趋势

消费降级加上运动热，如何影响到运动鞋服行业？

懒熊体育 2024-12-30

李想画起饼来，比马斯克还科幻

理想汽车的使命又变了？

雪豹财经社 2024-12-30

股神巴菲特出手抄底？股市扫货的巴菲特意欲何为？

巴菲特增持能源股，传递接班权。

江瀚视野 2024-12-30

男人最爱的龙头，卷不动了

真被低估了吗？

格隆汇 2024-12-30

钻石跳水、水晶卖爆，年轻人选择不信爱情信玄学

玄学赢了爱情

消费巴士 2024-12-30

「纽邦生物」获数千万元B轮融资，加速创新型膳食营养补充剂原料开发｜36氪首发

纽邦生物已打造全链条创新能力，每年推出5-10个膳食营养补充剂创新原料，拥有40余项To B“要素品牌”。

胡香赟 2024-12-30

一个超有用的投资评估指标

回归年化收益率

狐狸君raphael 2024-12-30

本想偷懒才用的 AI，没想到 AI 摸起鱼比我还厉害？

真正的「上梁不正下梁歪」。

极客公园 2024-12-30

区街镇产城品牌如何才能升格成为大城市超级IP

区街镇的小标签小符号小品牌正成为大城市的超级IP小切口？区街镇在所属城市IP产业名片打造过程中，往往面临资源不足、方向模糊等问题，自身本就不高的品牌势能、产业动能和文化效能容易淹没在城市品牌大战浪潮中，区街镇这些产城品牌又该如何破局呢？

石章强品牌营 2024-12-30

越南是如何融入世界和改革的？

再次寻觅融入世界的方向

复旦《管理视野》 2024-12-30

AI大模型本地化部署Q/A本地大模型部署篇

重要操作提示

推荐体验

相关资讯

AI大模型本地化部署Q/A硬件篇

还不会部署本地AI大模型？LangChat带你快速接入并部署本地大模型

手把手ChatGPT私有化本地化部署

随身wifi安装docker并部署本地化chatGPT

本地部署运行大模型

近期资讯

热潮继续，中国市场2024运动鞋服行业的6点趋势

李想画起饼来，比马斯克还科幻

股神巴菲特出手抄底？股市扫货的巴菲特意欲何为？

男人最爱的龙头，卷不动了

钻石跳水、水晶卖爆，年轻人选择不信爱情信玄学

「纽邦生物」获数千万元B轮融资，加速创新型膳食营养补充剂原料开发｜36氪首发

一个超有用的投资评估指标

本想偷懒才用的 AI，没想到 AI 摸起鱼比我还厉害？

区街镇产城品牌如何才能升格成为大城市超级IP

越南是如何融入世界和改革的？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响