visual-chatgpt可以通过对话让AI对图片进行分析和处理,对图片进行解释、按文字生成或修改图片等操作。本质上其实是ControlNet+ChatGPT,并不是一个能够直接对图片进行处理的多模态语言模型,而是ChatGPT在现有的AI图片处理技术上的一个应用。 完整将模型全部加载要几十G的显存,但其实没有必要,每次只要加载需要用到的部分即可,通过修改代码可以在十几G的显存上运行。原理简介原理图参数介绍User Query,符号Qi,用户第i轮提问,可以是文字或者图片Ouput,符号Ai,模型第i轮...【查看原文】