当前位置：首页|资讯

编译运行 llama.cpp (vulkan, Intel GPU SYCL)

作者：穷人小水滴发布时间：2024-09-23

首发日期 2024-08-23, 以下为原文内容:

llama.cpp 是一个运行 AI (神经网络) 语言大模型的推理程序,支持多种后端 (backend), 也就是不同的具体的运行方式,比如 CPU 运行, GPU 运行等.

但是编译运行 llama.cpp 并不是那么容易的,特别是对于 SYCL 后端 (用于 Intel GPU), 坑那是一大堆.只有特定版本的 llama.cpp, 特定版本的 Linux 系统和 GPU 驱动程序, 才可能成功运行,否则都是失败.能够运行的版本还不是最新版本, 经过了大量尝试和失败, 才获得了本文的结果.本文适用于 Intel GPU (A770) 和 Linux 操作系统.

这里是穷人小水滴, 专注于穷人友好型低成本技术.

相关文章:

《QEMU/KVM 虚拟机显卡透传 (vfio-pci)》

《自制神之嘴: fish-speech 容器镜像 (文本转语音 AI 大模型)》

目录

1 下载 llama.cpp 源代码

可以从网页下载: https://github.com/ggerganov/llama.cpp

也可以使用 git 命令 (下载 b3600 版本):

下载 b3038 版本:

vulkan 后端参考文档:

https://github.com/ggerganov/llama.cpp/blob/master/docs/build.md#vulkan
Run LLMs on Any GPU: GPT4All Universal GPU Support:https://www.nomic.ai/blog/posts/gpt4all-gpu-inference-with-vulkan

SYCL 后端参考文档:

https://github.com/ggerganov/llama.cpp/blob/master/docs/backend/SYCL.md

下载 GGUF 模型文件 (llama-2-7b.Q4_K_M.gguf):https://hf-mirror.com/TheBloke/Llama-2-7B-GGUF

2 编译 llama.cpp

为了方便, 窝们使用容器 (podman) 来进行编译.首先构建基础镜像, Dockerfile 如下:

执行命令:

结果:

2.1 编译 vulkan 后端

Dockerfile 如下:

执行命令:

结果:

2.2 编译 SYCL (Intel oneAPI) 后端

Dockerfile 如下:

执行命令:

结果:

3 运行测试

由于 Intel SYCL 只能在特定系统的特定驱动版本才能正常运行,所以使用了虚拟机 GPU 透传 (详见文章《QEMU/KVM 虚拟机显卡透传 (vfio-pci)》).

在这篇文章的虚拟机的基础上, 需要额外安装软件包:

重启虚拟机. 虚拟机内的相关信息如下:

把上面编译的 llama.cpp 程序 (以及 gguf 模型文件) 复制到虚拟机:

3.1 vulkan 运行测试

使用模型 llama-2-7b.Q4_K_M.gguf, 生成长度 200:

生成速度约为 25.90 tokens per second, 也就是每秒输出 25.9 个字符.

3.2 SYCL 运行测试

使用模型 llama-2-7b.Q4_K_M.gguf, 生成长度 200:

生成速度约为 30.53 tokens per second, 也就是每秒输出 30.5 个字符.

4 总结与展望

本文使用容器 (podman) 编译了 llama.cpp 的 vulkan 后端和 SYCL 后端,并成功在 Intel GPU (A770) 运行, 获得了较快的语言模型推理速度.

SYCL 后端比 vulkan 后端稍微快一点, 但不多.使用的模型 (gguf), 生成长度, 软件驱动版本, 运行参数设置等很多因素,都可能影响模型推理的速度, 所以本文中的运行速度仅供参考.

SYCL 比 vulkan 快不了多少, 但是使用 SYCL (Intel oneAPI) 却非常麻烦 !!所以, 至少目前为止, 对于 A770 (16GB) 显卡来说, 使用 vulkan 即可,强行使用 SYCL 的意义不大.

Intel 和 llama.cpp 对于 SYCL 还需要继续努力, 希望能够更方便, 更快速的运行大模型.

本文使用 CC-BY-SA 4.0 许可发布.

本文使用 Bilibili-Markdown 工具进行格式化排版:https://www.bilibili.com/read/cv18986956/

推荐体验

相关资讯

【穷玩AI】借助llama.cpp只用CPU跑通义千问对话模型

# AI 笔记 ## 编译llamp.cpp项目，在Window环境下跑对话模型以通义千问模型为例 ### Step0 工具软件、模型文件的下载和安装下载mingw-w64编译器和和配置环境变量配置 [下载地址](https://hub.gitmirror.com/https://github.com/brechtsanders/winlibs_mingw/releases/download/13.2.0posix-17.0.6-11.0.1-ucrt-r5/winlibs-x86_64-posi

LLaMA 通义千问 GitHub

笨笨小锅锅 2024-02-07

[LLM-Llama]在 MAC M1上体验Llama.cpp和通义千问Qwen 1.5-7B

本地运行与OpenAI完全兼容的个人LLM，llama.cpp的主要目标是在各种硬件上（本地和云端）实现LLM推断，同时保持最小的设置和最先进的性能。纯C/C++实现，没有任何依赖关系。赶快安装吧

LLaMA 通义千问 OpenAI

X2046 2024-05-22

[转载] i卡也能跑AI画图？Stable Diffusion with Intel Arc GPU运行实战

本文章转载自英特尔员工2023年2月3日的帖子:[https://medium.com/intel-analytics-software/stable-diffusion-with-intel-arc-gpus-f2986bba8365]参考文档：https://intel.github.io/intel-extension-for-pytorch/xpu/latest/tutorials/installation.htmlhttps://github.com/intel/intel-extension-

Stable Diffusion

亚平宁的伊比利亚 2023-02-12

无需高性能GPU，在MacBook（或linux）上运行对标GPT3的LLaMA模型教程

上周，Facebook“被”开源了其对标OpenAI的GPT3的大型语言模型LLaMA。Facebook称LLaMA模型是一个从7B到65B参数的基础语言模型的集合。在数万亿个token上训练们的模型，并表明可以完全使用公开可用的数据集来训练最先进的模型，特别是，LLaMA-13B在大多数基准测试中的表现优于GPT-3（175B）。但是，尽管拥有了泄露的模型，但是根据LLaMA官方的介绍，要想运行该模型需要30GB左右显存的显卡支持，这是个人电脑难以做到的。两天前，GitHub上的一位开发者ggergan

OpenAI GitHub LLaMA

羊驼大法 2023-03-13

使用AMD GPU运行ai绘画

安装显卡驱动以及rocmsudo apt install ./amdgpu-install_xxxxxxx-xxxxxx_all.debsudo apt updatesudo apt upgrade -ysudo amdgpu-install --no-dkmssudo apt install rocm-dev ls -l /dev/dri/render*sudo usermod -a -G render $LOGNAMEsudo usermod -a -G video $LOGNAMEsudo rebo

Zhoukker 2023-03-25

近期资讯

智能AI加持体验潮流科技：塞那S7S 耳夹式耳机真实体验分享

在快节奏的现代生活中，音乐已成为我们生活中不可或缺的一部分。有这样一款耳机凭借其独特的设计和出色的性能，在蓝牙耳机市场上引起了很大的关注。它就是Sanag塞那S7S 耳机，接下来，让我们一起来了解这款耳机的魅力所在。 [图片] 塞那S7S 耳夹式耳机充电仓的外观有着宛如鹅卵石般圆润设计，正面印有塞那品牌logo，整体造型让耳机有了极高的识别度。 [图片] 塞那S7S耳机采用了独特的耳夹式的设计，单耳重量仅为4g，轻巧到佩戴时几乎感受不到其存在，充电仓表面采用贝壳类独有的珠光亮面材质，触感细腻且富有光泽。

万小暖 2024-12-27

德语翻译公司提供哪些业务？德语口译/笔译收费标准解析

随着全球化进程的不断推进，越来越多的企业和个人在业务拓展、文化交流、学术研究等方面，迫切需要高质量、专业且高效的德语翻译服务。雅言翻译，作为一家领先的高端语言服务提供商，致力于为客户提供精准的德语翻译解决方案。德语翻译一直是公司核心服务之一，公司拥有一支专业的德语翻译团队，汇聚各领域优秀德语翻译人才，他们不仅有着深厚的语言功底，且有着深厚的行业背景和丰富的德语翻译经验。我们根据客户需求精准匹配最合适的译员，确保每一个德语翻译项目都能高效、精准地完成。一、德语笔译服务1、文件资料翻译在商业领域，涉及手

雅言Nora 2024-12-27

揭秘新疆无人机培训界的精英摇篮：CAAC执照，保华润天航空的卓越之旅！

在浩瀚无垠的新疆大地上，有一所被誉为“无人机飞行员摇篮”的神秘基地——新疆保华润天航空无人机培训中心。这里，不仅是技术的殿堂，更是梦想启航的地方。今天，就让我们一同揭开它的面纱，看看是如何将一群怀揣飞行梦想的普通人，锻造成为持有CAAC权威认证的无人机操控精英。走进保华润天，首先映入眼帘的是那一排排先进的无人机设备和宽敞明亮的教学区。这里采用的可是与国际接轨的CAAC（中国民用航空局）认证体系，确保每一位学员都能接受到最前沿、最专业的无人机理论知识与实操技能训练。课程内容从基础的无人机构造原理，到复杂的气

新疆无人机一杨 2024-12-27

pLVX-shRNA2载体质粒—艾普蒂生物

名称： pLVX-shRNA2载体目录号 IPD8225 质粒类型：慢病毒载体高拷贝/低拷贝：高拷贝启动子：CMV 克隆方法：多克隆位点，限制性内切酶载体大小：7881 bp 5' 测序引物及序列：LKO.1 5’:GACTATCATATGCTTACCGT 载体抗性：Ampicillin (氨苄青霉素) 筛选标记：ZsGreen1 备注：含有人U6启动子的慢病毒shRNA载体 [图片]

科研抗体蛋白 2024-12-27

Java期末考试题库，最后三天能捞一个是一个

宝子们，Java 期末考试就剩最后三天啦！是不是感觉时间紧任务重呀？别慌别慌，我给大家带来了超棒的 Java 期末考试题库，临时抱佛脚也能捞一个是一个呀? 【领取资料见文末】选择题：涵盖了 Java 的基础语法、数据类型、访问修饰符、关键字等知识点。比如 “Java 中的基本数据类型包括哪些”“以下哪个关键字用于定义一个类” 等等，都是常考的基础题，一定要多刷刷，把分稳稳拿到手.填空题：主要考察对特定代码段的理解和对 Java 语法的熟悉程度。像 “请写出 Java 中表示整数的数据类型”“Java

姨姨说编程 2024-12-27

Inslogic 哑光PLA | 高质感设计呈现

Inslogic 哑光PLA能够呈现平滑的层纹和高质量的成品。其在打印过程中翘曲较少，流动性优越，帮助您轻松实现高质量的打印效果，提升模型设计的格调。 [图片] Inslogic 哑光PLA耗材以其出色的细节呈现和独特的哑光质感著称。它不仅能够有效隐藏层纹，展现模型细节，还提供多种颜色选择，既适合经典设计，又能完美融入现代风格，成为许多追求美学效果的 3D 打印作品的理想选择。 [图片] 此外，Inslogic 哑光PLA具有出色的坚韧性和耐用性，良好层间黏着力和较小的翘曲度确保每次打印更加稳定，无论是复

Inslogic3D 2024-12-27

AI 虹膜识别：引领未来身份识别潮流，这些应用场景超乎想象！

在科技浪潮汹涌澎湃的今天，人工智能与生物识别技术的融合正以前所未有的速度改变着我们的生活。虹膜识别，作为生物识别领域的一颗璀璨明珠，在人工智能的助力下，焕发出更加耀眼的光芒。前沿科技碰撞：AI 与虹膜识别的奇妙融合AI 技术的飞速发展，为虹膜识别带来了前所未有的变革。深度学习算法的深度应用，使得虹膜识别系统仿佛拥有了 “火眼金睛”。它能够对虹膜图像进行超精细的分析，自动学习和提取最具代表性的特征，从而实现了更高的识别准确率。就好比给虹膜识别装上了一台超级智能引擎，让它在面对复杂多样的虹膜样本时，都能精准无

思源科安虹膜识别 2024-12-27

AI 视觉检测系统是什么？

AI 视觉检测系统是人工智能与计算机视觉技术相结合的产物，旨在对图像或视频中的内容进行精确的分析、理解和判断。它能够精准地识别出图像中的各种对象、特征以及模式，例如在工业生产线上，它可以准确识别出产品的外观缺陷、零部件的装配是否正确等，这是传统检测方法难以企及的精度水平。与传统的机器视觉相比，AI 视觉检测更加智能化。传统机器视觉主要是对图像进行简单的处理和分析，如测量尺寸、检测形状等基本任务。而 AI 视觉检测通过深度学习等智能算法深入理解图像的语义信息，不仅可以识别出 “是什么”，还能对识别

工业视觉检测 2024-12-27

正式入列亚冬！吉利向哈尔滨亚冬组委交付350辆醇氢电混汽车

12月27日，吉利汽车正式将350辆醇氢电混汽车，交付给了哈尔滨2025年第九届亚冬会组委会。作为本届亚冬会官方指定用车，吉利此次交付的第四代帝豪醇氢电混汽车将与此前交付的纯电、电混等智能精品车型一起，在火炬传递、交通保障、礼宾服务等多个场景服务亚冬会。这也是甲醇汽车首次大规模服务大型综合性国际体育赛事，是吉利全球首创零碳甲醇点燃亚运主火炬后的又一次创举。甲醇不仅是全球公认的新型清洁可再生能源，更是破解北方新能源困局的最优解。由于哈尔滨等北方地区冬季气温低，电池的性能大幅降低，直接影响纯电动汽车续航里程。

21CN车言车话 2024-12-27

宝马驾驶宝典：如何寻找每个弯道的最佳赛车路线

（本文翻译自“宝马驾驶”官方网站）赛车路线——这是每个赛车手都在寻找的东西，但并不是所有人都知道如何找到。这次我们的专家将揭晓如何寻找最佳赛车路线的12个方式，并将你的赛车技巧提升到另一个层次。 [图片] 你在驾驶卡丁车时，对手是否经常在你旁边呼啸而过？如果是的话，其实经常并不是你的赛车出现了问题。更有可能的是，别人比你能够更精确地寻找赛车路线。其实在正式赛车中，赛车路线的重要性非常大。与此同时，车队和驾驶员经常日夜加班的分析每一条赛道的最佳速度的行驶路线。克劳迪娅.赫特根（Claudia Hür

佐罗亚特 2024-12-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1