引言 在人工智能的迅猛发展中,多模态大模型成为了新的研究热点。阿里云推出的Qwen-VL模型,就是在这一领域的重要突破。作为一款基于70亿参数的通义千问模型Qwen-7B开发的多模态视觉语言模型,Qw...【查看原文】
目前已经在 ModeScope 开源。
通义千问
李旭 2023-08-25
阿里云今天宣布推出开源大规模视觉语言模型Qwen-VL。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。
2023-08-25
Qwen-VL 是阿里云研发的大规模视觉语言模型(Large Vision Language Model, LVLM)。Qwen-VL 可以以图像、文本、检测框作为输入,并以文本和检测框作为输出
秋之 2023-09-22
继 8 月初阿里云开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat 后,又一大模型实现了开源。
凌敏 2023-08-25
1月26日,阿里云公布多模态大模型研究进展。通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后,再次推出Max版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩,比肩OpenAI的GPT-4V和谷歌的GeminiUltra。
通义千问编程OpenAI谷歌
智能相对论 2024-01-26
36氪 2024-12-30
汉堡王打价格战是自寻死路?
首席商业评论 2024-12-30
华人女科学家带队,7年融资60亿。
猎云网 2024-12-30
IT之家 2024-12-30
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1