当前位置：首页|资讯

在线教程 | 打败 GPT-4V？超强开源多模态大模型 LLaVA-OneVis

作者：HyperAI超神经发布时间：2024-10-16

大语言模型（Large Language Model，简称 LLM）与多模态大模型（Large Multimodal Model，简称 LMM）是人工智能领域的两个核心发展方向。LLM 主要致力于处理和生成文本数据，而 LMM 则更进一步，它旨在整合和理解包括文本、图片、视频在内的多种数据类型。如今，LLM 已经相对成熟，ChatGPT 等在文字理解方面已经「对答如流」，人们开始将目光转移到多模态数据的理解上，令模型能够「读图、看视频」。近期，来自字节跳动、南洋理工大学、香港中文大学和香港科技大学的研究...【查看原文】

推荐体验

相关资讯

限时免费！国产多模态大模型重磅升级：性能赶超GPT-4V

快科技1月26日消息，今日，阿里云公布多模态大模型研究进展。据悉，通义千问视觉理解模型Qwen-VL再次升级，继Plus版本之后，再次推出Max版本，升级版模型拥有更强的视觉推理能力和中文理解能力

朝晖 2024-01-26

多模态开源大模型来啦跨设备跑 Llava-v1.6-Vicuna-7B

Llava-v1.6-Vicuna-7B[1] 是开源社区对 OpenAI 多模态大模型 GPT-4-V 的回应。它也称为视觉语言模型，因为它能够处理对话中的视觉图像和语言。该模型基于 lmsys/vicuna-7b-v1.5。在本文中，我们将介绍如何为 Llava-v1.6-Vicuna-7B 创建兼容 OpenAI 的 API 服务。我们将使用 LlamaEdge（Rust + Wasm 堆栈）来开发和部署该模型的应用程序。无需安装复杂的 Python 包或 C++ 工具链！看看我们为什么选择这个

Vicuna OpenAI GPT-4

Second_State 2024-03-04

Claude 3 惊喜上线：多模态能力比肩GPT-4V

作者：赖文昕、郭思编辑：陈彩娴过去不到一个月，OpenAI扔出Sora这个重磅炸弹后成为全球焦点，不

Claude Sora OpenAI

雷锋网 2024-04-02

清华团队攻破GPT-4V、谷歌Bard等模型，商用多模态大模型也脆弱？

机器之心专栏机器之心编辑部GPT-4近日开放了视觉模态（GPT-4V）。以GPT-4V、谷歌Bard为代表的多模态大语言模型(MultimodalLargeLanguageModels,MLLMs)将文本和视觉等模态相结合，在图像描述、视觉推理等各种多模态任务中展现出了优异的性能。

清华谷歌 Bard GPT-4 大语言模型

机器之心Pro 2023-10-17

多模态大模型，阿里通义千问能和GPT-4V掰手腕了

2024年，大模型领域要卷什么？Qwen-VL支持以图像、文本作为输入，并以文本、图像、检测框作为输出，让大模型真正具备了「看」世界的能力。

机器之心Pro 2024-01-29

近期资讯

2024VDC蓝河分会场：蓝河操作系统2 全栈自研为AI而生

10月10日，以“同心·同行”为主题的2024vivo开发者大会在深圳成功举办，在同期举办的蓝河分会场上，vivo多位专家及产业界、学术界伙伴分享了在AGI时代下，蓝河操作系统带来的技术创新与实践，vivo希望携各方共建生态，为用户带来更高效、更便捷的服务体验，共同推动整个行业的发展繁荣！

雷科技 2024-10-12

赛意信息PCB行业大模型与华为昇腾AI完成兼容性测试认证

近日，广州赛意信息科技股份有限公司（简称“赛意信息”，300687.SZ）自主研发的“基于善谋GPT的PCB行业大模型”成功与华为技术有限公司AI框架昇思MindSpore完成相互兼容性测试，并取得华为昇腾技术认证书及AscendCompatible徽标的使用权。

中国财富网 2024-10-12

华为云参与云原生安全配置基线规范V2.0，并首批通过能力评估

近日，2024ICT中国·高层论坛·云原生发展论坛在北京国家会议中心成功举办，中国信息通信研究院联合华为云等多家单位发布了《云原生安全配置基线规范V2.0》，华为云安全领域产品总监范彦军作为代表出席了发布仪式。

华为云 2024-10-12

HarmonyOS NEXT已启动公测：基于OpenHarmony开发，技术上具备五大特征

10月12日第三届OpenHarmony技术大会在上海成功举办。“技术上，OpenHarmony具备”架构解耦、弹性扩展”、“异构并行、全栈协同”、“原生智能、场景体验”、“原生安全、生态纯净”、“极简开发、多端部署”五大技术特征。

和讯网 2024-10-12

显著提升路网运行效率！广东一智慧交通创新项目斩获科技大奖

近日，广东省交通集团所属广东联合电子服务股份有限公司（以下简称“广东联合电服公司”）牵头完成的智慧交通创新项目“广东省高速交通流全网智能监测技术研发与应用”荣获2024年度中国智能交通协会科技进步二等奖。

深圳商报 2024-10-12

专访｜南威软件董事长吴志雄：AI驱动创新，为科技自立自强注入新动能

对中国企业而言，在新的浪潮中，构建自身的核心技术便成了重中之重：一面是“民族”，要确保安全与可控，一面是“产业”，要寻求创新和发展。作为信创领域的领军企业，南威软件（603636.SH）始终与“国产自主可控”密不可分，如今机遇与挑战皆在眼前，这艘从福建启航的“巨轮”将驶向何方？

金融界 2024-10-12

中国移动董事长杨杰：5G网络已经成为社会信息流动的主动脉

2024年10月11日至13日，2024中国移动全球合作伙伴大会在广州举行。目前5G套餐用户超7.8亿户、5G+行业应用案例超4万个。5G应用加速了数字产业化和产业数字化进程，有力带动了数字经济和实体经济的融合发展。据测算，5G直接带动我国经济总产出约5.6万亿元，间接带动总产出约14万亿元。

北青网 2024-10-12

趋境科技发布大模型知识推理一体机，首创“以存换算”和“全系统推理架构”，助力企业高效推理

随着大模型，尤其是开源大模型的持续进化，具备复杂推理能力的模型正在逐步应用于各行各业，并展现出超越人类专家的潜力。华福证券的研究指出，到2027年，推理端的人工智能服务器预计将占整体工作负载的72.6%。

央广网 2024-10-12

OPPO K12Plus评测：超大电量，兼并续航与耐用

　OPPOK系列一直以来都是以解决中端机卡顿，发热，电池小，充电慢这一类的痛点为目标，为用户打造一款好用且耐用的手机。而作为K系列的新机，OPPOK12Plus主打的就是大电池+快充这一同档位领先的续航组合。

IT168 2024-10-12

上海大学发表论文，展示深度学习技术在材料微纳结构成像技术中的应用

10月12日消息，上海大学材料基因组工程研究院于10月9日在JournaloftheAmericanChemicalSociety（JACS）上发表论文，展示了深度学习技术在材料微纳结构成像技术中的应用。IT之家注：STM是用于成像和操控单个原子和分子的工具，在纳米科技和表面科学领域具有不可替代的重要作用。

IT之家 2024-10-12

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1