多模态大模型再更新！集简云与语聚支持通义千问qwen-vl-plus大模型

作者：集简云发布时间：2024-03-01

集简云通义千问

去年，GPT-4V的亮相，我们见证了商业模式和应用实践的重大转变。随着视觉模型向新领域的进军，通义千问也换新升级，推出具备图文理解能力的Qwen-VL，成为最强国产视觉语言模型。

基于通义千问语言模型开发，其性能更是与GPT-4V相媲美，更新和升级在多个方面显示出强大的优势和潜力。为了让集简云用户能快速体验该多模态模型的能力，我们已将Qwen-VL-Plus版本接入到集简云中，您可快速体验它的能力。

功能亮点

➢ 首个支持中文开放域定位的通用模型

通过中文开放域语言表达进行检测框标注，能在画面中精准地找到目标物体。

➢ 识别、提取分析图像及其文本能力增强

在图像处理中，Qwen-VL-Plus能够更好地识别、提取和分析图像中的文本细节，从而更好地理解和处理复杂的视觉信息。

➢ 支持超过一百万像素的高清图像

Qwen-VL-Plus针对细节识别和文本识别进行升级，支持高达数百万像素的超高像素分辨率。

➢ 任意宽高比的图像处理

Qwen-VL-Plus和Qwen-VL-Max支持处理任意宽高比的图像，增强了模型的灵活性。

功能亮点

通过中文开放域语言表达进行检测框标注，能在画面中精准地找到目标物体。

示例1：逻辑推理能力

图中展示的流程图是什么？有几条路径？

这张图片显示的是一个关于费用报销单据审核流程的图表。它是一个带有决策点和不同分支选项的标准流程图，用于描述在系统内处理费用报销申请时所遵循的一系列步骤。

从左上角开始：

登录费用报销系统。

打开待审批的费用报销单。

阅读附件发票信息，并通过OCR识别来获取数据（这一步可能包括验证发票的真实性）。

自动完成审批过程并保存审计记录到汇总表。

检查是否符合企业内部规定：是则继续；否，则返回第6步进行修正或拒绝此报账请求生成异常数据记入汇总表。

发票与报销单内容核对一致吗? 是的话就进入下一步; 否, 则回到第4步检查其他条件或者直接拒绝该报销请求并将相关异常情况录入总表；

最后一步是对发票真伪进行核实，在这里需要登录国税局网站查询发票真实性；如果发现不真实的情况出现那么就需要重新调整整个流程直到所有环节都满足要求为止最后将所有的非正常状态的数据全部归集起来形成最终报告输出给相关人员参考使用.

这个流程中有三条主要路径：

第一条是从第一步到最后一步的所有可能途径。

第二条是在第三、四两步之间选择的不同方式取决于前面的信息输入结果如何决定后续操作方向。

第三类则是针对第五至第七项之间的判断逻辑而产生的额外分叉路线。

示例2：信息识别处理

分析图中数据，并制作成表格。

示例3：商品图片识别

帮我生成商品描述

这款裙子采用了传统的汉服设计，上身是一件白色长袖对襟衣，下身则是一条棕色的马面裙。这种服装风格在中国历史上非常流行，并且在现代也逐渐得到了复兴。

这件衣服的设计十分精致，尤其是那件白色的对襟衣，它的领口和袖口都绣有精美的花纹，给人一种清新脱俗的感觉。而那条棕色的马面裙更是让人眼前一亮，它不仅颜色深沉、质感高级，而且上面还印有一些金色的图案，这些图案都是用金线刺绣而成的，既华丽又不失庄重。

总的来说，这是一款非常适合日常穿着或者参加一些正式场合的衣服。无论是从材质还是做工来看，都可以看出制作者对于细节的关注以及对于品质的要求。如果你想要一款既能展现自己优雅气质又能体现中国传统文化元素的衣物的话，那么这款裙子绝对是一个不错的选择！

如何在集简云/语聚中使用

方式1：在数据流程搭建时选择通义千问（内置）应用（无需账户）。

方式2：数据流程搭建时选择通义千问原生（需要账户）。

方式3：语聚AI（http://chat.jijyun.cn)的对话助手中。

相关资讯

大模型晚报｜阿里云开源通义千问多模态大模型Qwen-VL

阿里云今天宣布推出开源大规模视觉语言模型Qwen-VL。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入，具备多模态信息理解能力。

通义千问

2023-08-25

阿里云开源通义千问多模态视觉模型Qwen-VL

目前已经在 ModeScope 开源。

通义千问

李旭 2023-08-25

多模态大模型Claude 3正式接入集简云与语聚！对标GPT-4且支持中文

自OpenAI发布GPT-4以来，引发了业务模式与应用使用的巨大变革，掀起了各大企业对于多模态大模型的研究热潮。3月初，AnthropicClaude在官网正式发布Claude 3系列多模态大模型，据了解，该模型在多个维度上超越了GPT-4，为您总结一波Claude 3的部分能力提升：OCR和复杂场景解析方面提升；解决高级数学和科学问题的能力增强；轻松处理多语言文本；可处理超过一百万个令牌的输入；遵循具体指令完成创造性任务能力提升。claude 3分为Haiku、Sonnet和Opus三个版本，目前集简云

Claude 集简云 GPT-4 OpenAI

集简云官方账号 2024-03-12

通义千问能看图了！阿里云开源视觉语言大模型Qwen-VL ，支持图文双模态输入

继 8 月初阿里云开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat 后，又一大模型实现了开源。

通义千问

凌敏 2023-08-25

集简云新增通义千问qwen 72b chat、qwen1.5 等多种大语言模型，提升多语言支持能力

通义千问再开源！继发布多模态模型后，通义千问 1.5 版本也在春节前上线。此次大模型包括六个型号：0.5B、1.8B、4B、7B、14B 和 72B，性能评测基础能力在在语言理解、代码生成、推理能力等多项基准测试中均展现出优异的性能，且支持多语言。为了满足用户对多种AI模型的需求，快速体验到更加强大和多样化的AI能力，集简云目前已将以下应用模型快速接入到平台内，您可在通义千问模型开源版（原生）和通义千问（内置）中使用。模型亮点基础性能增强：通义千问团队进行的测试显示，Qwen1.5在各种评估基准上都显示出

集简云通义千问大语言模型编程

集简云官方账号 2024-03-06

近期资讯

榆笙媞申请面向干细胞培养的数据分析方法及系统专利，能提高预测的精度与准确性

金融界2024年12月26日消息，国家知识产权局信息显示，榆笙媞（山东）生物科技有限公司申请一项名为“一种面向干细胞培养的数据分析方法及系统”的专利，公开号CN119181424A，申请日期为2024年8月。

金融界 2024-12-26

站在风口的AI玩具：价格不菲仍卖爆，是儿童“新宠”还是智商税

“让葫芦娃和孙悟空，在山头一起大战白骨精。”用户可将该产品以挂件的形式佩戴在任何玩偶身上，该挂件可提供知识问答、生成式故事以及唱儿歌等功能。

新京报 2024-12-26

如何轻松上传音乐到酷狗平台，分享你的创作与热情

上传自己的音乐到酷狗是一件很酷的事情，不仅可以让更多的人听到你的作品，还能与其他音乐爱好者互动。今天，我就来详细聊聊这个过程，让你轻松上手。在开始之前，首先要确保你有一首准备好的音乐作品。可以是自己创作的歌曲，或者是翻唱的曲目。无论是什么类型，只要是你认为值得分享的音乐，都可以尝试上传。

新报观察 2024-12-26

一加 Ace 5 系列手机发布，售价 2299 / 3399 元起

IT之家12月26日消息，一加Ace5系列手机今日正式发布，系列新机分别搭载高通骁龙8Gen3/至尊版处理器，配备旗舰同款索尼IMX906主摄，售价2299/3399元起（12GB+256GB）。新机延续三段式按键设计、拥有AcePerformance专属标识、配备OPPO晶盾玻璃、使用直角金属中框设计、并提供陶瓷机身版本。

IT之家 2024-12-26

解码新质生产力｜山东日照：创新“出海” 行业争先

近日，在刚刚结束的第八届巴基斯坦工业展会上，日照惠明机械设备有限公司携带多款自主研发的雕刻机、加油机、充电桩参展，凭借较强的工业设计能力和精准的售后服务，公司产品被客户争相订购。“这是我们销往迪拜的一台五轴铝型加工中心，该产品我们自主研发，并且已经申请专利，产品已经销往全世界六七十个国家。”

金台资讯 2024-12-26

美的MR-195WE冰箱：1199元享风冷无霜，节能低噪的理想选择

#年货节好物集市#在家电市场中，美的以其高性价比和卓越的产品质量赢得了广泛的消费者认可。特别是在租房市场中，美的冰箱以其节能、低噪音和风冷无霜的特点，满足了现代都市人对于家电的多样化需求。

小米地瓜 2024-12-26

阶跃星辰发布 Step-1X-Medium 模型创作能力提升

【环球网科技综合报道】12月26日消息，据阶跃星辰官方公众号消息，其宣布推出Step-1X-Medium增强AI模型，显著提升生成速度、理解能力、细节质感以及创作功能，目标成为创作者的得力助手。升级后的模型能够更精准地理解用户指令，生成更契合需求的图像作品，并新增了“图生图”的垫图、风格迁移等更丰富的创作玩法，进一步降低创作门槛。

环球网科技 2024-12-26

性能新标杆，一加Ace5正式发布：第三代骁龙8，2299元的性能野兽

终于，在万众期待中，一加Ace5正式发布，这款新机不仅继承了一加Ace系列的高性能基因，更在硬件配置和技术创新上实现了新的突破。它搭载了第三代骁龙8移动平台，这款芯片以其强大的性能和高效的功耗控制而闻名。

小米地瓜 2024-12-26

如何在苹果手机上轻松为照片添加马赛克以保护个人隐私

苹果手机作为一款广受欢迎的智能设备，提供了一些简单易用的工具，可以帮助我们轻松地对照片进行马赛克处理。那么，具体该怎么操作呢？

新报观察 2024-12-26

RTX 5090 GB202 GPU芯片首次现身：744平方毫米史上第三大

快科技12月26日消息，刚刚看过RTX5090非公版的PCB裸板谍照，GPU核心照又第一次出现在我们面前，就是大名鼎鼎的GB202。从照片可以证实，完整的核心编号为GB202-300-A1，与传闻相符。

驱动之家 2024-12-26

多模态大模型再更新！集简云与语聚支持通义千问qwen-vl-plus大模型

推荐体验

相关资讯

大模型晚报｜阿里云开源通义千问多模态大模型Qwen-VL

阿里云开源通义千问多模态视觉模型Qwen-VL

多模态大模型Claude 3正式接入集简云与语聚！对标GPT-4且支持中文

通义千问能看图了！阿里云开源视觉语言大模型Qwen-VL ，支持图文双模态输入

集简云新增通义千问qwen 72b chat、qwen1.5 等多种大语言模型，提升多语言支持能力

近期资讯

榆笙媞申请面向干细胞培养的数据分析方法及系统专利，能提高预测的精度与准确性

站在风口的AI玩具：价格不菲仍卖爆，是儿童“新宠”还是智商税

如何轻松上传音乐到酷狗平台，分享你的创作与热情

一加 Ace 5 系列手机发布，售价 2299 / 3399 元起

解码新质生产力｜山东日照：创新“出海” 行业争先

美的MR-195WE冰箱：1199元享风冷无霜，节能低噪的理想选择

阶跃星辰发布 Step-1X-Medium 模型创作能力提升

性能新标杆，一加Ace5正式发布：第三代骁龙8，2299元的性能野兽

如何在苹果手机上轻松为照片添加马赛克以保护个人隐私

RTX 5090 GB202 GPU芯片首次现身：744平方毫米史上第三大

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响