介绍 随着ChatGPT的横空出世,国内互联网大厂、创业公司纷纷加了AIGC赛道,不断推出各种大模型...【查看原文】
书接上文,我在 ollama 中部署 qwen1_5-14b-chat-q4_k_m.gguf 预量化模型,在非 Stream 模式下需要 89 秒才完成一轮问答,响应速度实在是太慢,后续想办法优化
AIGC
Kida的技术小屋 2024-05-13
忙里偷闲在本地部署了一套 stable-diffusion 来玩玩,虽然 Mac 还是使用 CPU 来生图,但是整体效果(生成时间、生成效果)还是能够接受的。
Stable Diffusion
kida_yuan 2024-02-06
转:NVIDIA 的朋友和我说他们内部一律都是 ubuntu,cuda 生产环境不建议用 debian、ubuntu 之外的任何系统,只会徒增烦恼。操作系统建议Ubuntu22,长期维护版本。这个是浪潮NF5568M4,超微7048同款安装显卡驱动这里点击附加驱动选择上面这个驱动后,点击应用更改驱动安装成功后,可以看到这watch nvidia-smi安装CUDA:https://developer.nvidia.com/cuda-downloads只需要执行Base Install命令如果已经通过图形安
AI大模型
门的耳朵 2024-03-24
本文介绍了使用ollama在本地部署大模型,通过本地部署的客户端与大模型交互,并且简单体验了RAG。最后简单介绍了在本地搭建chatgpt 3.5的代理,可以免密钥的方式访问openai的api。
ChatGPTOpenAI
小豪11 2024-04-19
玩转 AIGC:仅需三步,在 Mac 电脑部署本地大模型,打造私人 ChatGPT 你好,欢迎来到运维有术。 今天分享的内容是 玩转 AIGC「2024」 系列文档中的 仅需三步,在 Mac 电脑打造
AIGCChatGPT
运维有术 2024-05-02
【LangGraph】手把手实现人类怎么和agent的交互 LangGraph 是一个使用 LLM 构建有状态、多参与者应用程序的库,用于创建代理和多代理工作流。与其他 LLM 框架相比,它具有以下核
用户149562046117 2024-12-30
本文介绍如何通过Java SDK获取已创建的Collection对象。 如插入Doc、检索Doc、管理Partition等
DashVector 2024-12-30
本系列文章是langchain框架v0.3版本的学习实战笔记。本文我们将详细介绍自定义路由链的构建原理,包括基于大模型决策的路由链、基于向量相关性检索的路由链,以帮助大家理解实现路由决策的底层机制。
小嘴叭叭儿 2024-12-30
在开发过程中,我们经常需要与GPT等大模型进行交互,并解析其返回的内容。传统的做法可能是手动编写正则表达式来提取所需的信息,但这种方式不仅繁琐,还容易出错。今天,我将介绍一种更优雅、更高效的方式——使
大橙子打游戏 2024-12-30
Solid.js,一个比 React 更 react 的框架。每一个使用 React 的同学,你可以不使用,但不应该不了解。我同时搭建了 Solid.js 最新的中文文档站点:https://soli
冴羽 2024-12-30
## 1 前后端开发模式的演变 jQuery时对大部分Web项目,前端不能控制路由,要依赖后端项目的路由系统。通常,前端项目也部署在后端项目的模板里,项目执行示意图: 来表示。DisplayMetrics类中有几个与屏幕密度相关的字段: density:屏幕密度,即屏
BoomHe 2024-12-30
在网上冲浪的时候,发现一个很好玩的项目,MusicGPT,这个项目有趣的点,除了是把Music和GPT结合,还有一点,是使用Rust开发的大模型应用项目,跟通常用python开发的应用截然不同。前端使
大模型web服务部署—open-webui 这里我们使用的是一个叫做open-webui的开源项目 目前这个项目在Github 上已经得到了比较高的star 数 这个项目提供了多种部署方式,这里我们使
刘不二 2024-12-30
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1