引言 在人工智能的迅猛发展中,多模态大模型成为了新的研究热点。阿里云推出的Qwen-VL模型,就是在这一领域的重要突破。作为一款基于70亿参数的通义千问模型Qwen-7B开发的多模态视觉语言模型,Qw...【查看原文】
目前已经在 ModeScope 开源。
通义千问
李旭 2023-08-25
阿里云今天宣布推出开源大规模视觉语言模型Qwen-VL。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。
2023-08-25
Qwen-VL 是阿里云研发的大规模视觉语言模型(Large Vision Language Model, LVLM)。Qwen-VL 可以以图像、文本、检测框作为输入,并以文本和检测框作为输出
秋之 2023-09-22
继 8 月初阿里云开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat 后,又一大模型实现了开源。
凌敏 2023-08-25
1月26日,阿里云公布多模态大模型研究进展。通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后,再次推出Max版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩,比肩OpenAI的GPT-4V和谷歌的GeminiUltra。
通义千问编程OpenAI谷歌
智能相对论 2024-01-26
摩尔线程近日在官网上上线了一款新的专业视觉加速卡:MTTX300,该款显卡是摩尔线程第二款专业视觉加速卡,上一款是MTTS50。显卡配备16GBGDDR6显存,显存位宽256bits,显存带宽448GB/s,接口支持PCIeGen5×16。
砍柴网 2024-12-31
IT之家12月31日消息,VIOMI云米现已在小米有品上架一款智能门锁2APro人脸猫眼版,标准定价999元,IT之家附商品页如下(点此访问)。据介绍,这款人脸门锁搭载3D结构光人脸识别技术,同时自带红外补光LED、微波雷达人体感应,人脸识别距离0.3-1米,身高覆盖范围1.2-2米,门锁内部配有4英寸IPS面板便于用户操作互动。
IT之家 2024-12-31
12月31日消息,小米REDMITurbo4手机将于1月2日14:00,今日官方公布了新机的电池信息。据介绍,REDMITurbo4搭载6550mAh最大小米金沙江电池,支持1600次四年耐用长循环(在25℃标准环境下,按照一天一次满充满放进行测试,约等于使用4年后剩余容量80%)。
IT之家12月31日消息,科技媒体AndroidAuthority今天(12月31日)发布博文,报道称谷歌计划升级安卓15系统的“跨Pixel设备关闭通知”功能,将支持通过蜂窝网络同步该功能,进一步提升用户体验。
12月31日消息,机械革命官方昨日进一步对其CES2025新品参展阵容进行预热,发布了一张内含MiniLED、OLED屏幕笔记本的海报,并表示这些屏幕具有高分辨率、高刷新率、高亮度的三大优势,同时经过X-Rite/Pantone校色。
金融界2024年12月31日消息,国家知识产权局信息显示,深圳市盛世美行科技有限公司取得一项名为“一种用于车载360全景影像装置”的专利,授权公告号CN222224046U,申请日期为2024年1月。
金融界 2024-12-31
《笔记本怎么看》在这个信息爆炸的时代,笔记本成为了我们生活中不可或缺的一部分。无论是上课、开会,还是日常的思考和记录,我们都离不开这个小小的工具。
新报观察 2024-12-31
在日常生活和工作中,打印机是我们不可或缺的工具之一。无论是在办公室打印文件,还是在家里打印照片,打印机都发挥着重要的作用。
金融界2024年12月31日消息,国家知识产权局信息显示,天创壹洲(天津)科技有限公司取得一项名为“一种自动驾驶中控交互设备”的专利,授权公告号CN222224039U,申请日期为2024年5月。专利摘要显示,本实用新型涉及汽车自动驾驶中控交互领域,尤其涉及一种自动驾驶中控交互设备。
金融界2024年12月31日消息,国家知识产权局信息显示,重庆冀繁科技发展有限公司取得一项名为“一种带有摄像头的车载GPS定位仪“的专利,授权公告号CN222224040U,申请日期为2024年5月。”
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1