前言:LLAMA是一种神经网络模型,全称为Language Model with an Average Attention Mechanism(具有平均注意机制的语言模型)。它是一种用于自然语言处理任务的模型,特别适用于生成文本和回答问题。LLAMA模型结合了注意力机制和平均池化,以提高模型对输入文本的理解和生成能力。它在多项基准测试中取得了很好的性能,是一种强大的语言模型。
此文章以基于OpenAI聊天模型训练而来的openchat_3.5.Q3_K_L模型为例进行实现。
下载必备软件:(这一步就不详写,自行安装
MicroSoft VS,https://visualstudio.microsoft.com/zh-hans/vs/
CMAKE,https://cmake.org/download/
Git,https://git-scm.com/downloads
下载本例子的AI模型:openchat_3.5.Q3_K_L,https://huggingface.co/TheBloke/openchat_3.5-GGUF/blob/main/openchat_3.5.Q3_K_L.gguf
下载LLAMA插件:Llama-Unreal(我的教程后面修改了部分代码,请支持插件原作者MikaPi,https://github.com/getnamo/Llama-Unreal
新建空白C++项目后关闭引擎,并打开项目文件夹:
项目文件夹中创建Plugins文件夹并放入TTS和LLAMA插件:
进入LLAMA插件文件夹,右键空白区域打开Git:
llama文件中放入下载解压好的llama.cpp:llama.cpp兼容版本,https://github.com/ggerganov/llama.cpp/archive/a40f2b656fab364ce0aff98dbefe9bd9c3721cc9.zip
创建build文件夹进行cmake编译:
生成成功:
1.我们需要的文件是llama.dll:
2.llama插件的Includes和Libraries文件夹中已经有了所有需要的文件,遂不需要复制。
修改UELlama.Build.cs:(修复打包后dll缺失
编译生成项目成功:
打开项目:
1.新建Blueprints文件夹,新建空白关卡LLAMA;游戏模式GM_LLAMA(不要创建错成游戏模式基础);玩家控制器PC_LLAMA,HUD类HUD_LLAMA,用户控件WBP_MainLLAMA。
2.项目设置中指定游戏默认地图为LLAMA,世界场景设置中指定游戏模式为GM_LLAMA,控制器为PC_LLAMA,HUD为HUD_LLAMA。
3.编写HUD蓝图和用户控件WBP_MainLLAMA:
(0.HUD蓝图与函数:
(1.添加llama组件;
(2.指定Prompt值;
(3.指定语言模型的路径;
(4.指定Stop Sequences:
(5.编辑用户控件WBP_MainLLAMA:
添加函数Add Token:
事件图表:
后言:该项目实现了离线AI聊天功能,响应及时。但目前还有部分问题如:回答中文时部分文字呈现为?号,可能根据不同模型有不同的问题,可以自行测试该网站中的其他语言模型。
希望这篇文章能帮到你!!