当前位置:首页|资讯

Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

作者:机器之心发布时间:2024-12-18

Florence-VL 提出了使用生成式视觉编码器 Florence-2 作为多模态模型的视觉信息输入,克服了传统视觉编码器(如 CLIP)仅提供单一视觉表征而往往忽略图片中关键的局部信息。...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1