Pixtral 12B 发布：Mistral 首款多模态 AI 大模型

作者：IT之家发布时间：2024-09-12

IT之家 9 月 12 日消息，科技媒体 TechCrunch 昨日（9 月 11 日）报道，法国 AI 初创公司 Mistral 发布 Pixtral 12B，是该公司首款能够同时处理图像和文本的多模态 AI大语音模型。

Pixtral 12B 模型拥有 120 亿参数，大小约为 24GB，参数大致对应于模型的解题能力，拥有更多参数的模型通常比参数较少的模型表现更优。

Pixtral 12B 模型基于文本模型 Nemo 12B 构建，能够回答关于任意数量、任意尺寸图像的问题。

与 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o 等其他多模态模型类似，Pixtral 12B 理论上应能执行诸如为图像添加描述和统计照片中物体数量等任务。

用户可以下载、微调 Pixtral 12B 模型，并能依据 Apache 2.0 许可证使用。

Mistral 开发者关系负责人 Sophia Yang 在 X 平台的一篇帖子中表示，Pixtral 12B 很快将在 Mistral 的聊天机器人和 API 服务平台 Le Chat 及 Le Plateforme 上开放测试。

IT之家附上相关跑分情况如下：

参考

相关资讯

Mistral联合英伟达开源12B小模型：碾压Llama 3，单张4090可跑

小模型，成为本周的AI爆点。与动辄上千亿参数的大模型相比，小模型的优势是显而易见的:它们不仅计算成本更低，训练和部署也更为便捷，可以满足计算资源受限、数据安全级别较高的各类场景。因此，在大笔投入大模型训练之余，像 OpenAI、谷歌等科技巨头也在积极训练好用的小模型。先是HuggingFace推出了小模型SmoLLM；OpenAI直接杀入小模型战场，发布了GPT-4o mini。GPT-4o mini发布同天，欧洲最强AI初创公司Mistral立马发布旗下最新最强小模型——Mistral NeM

英伟达 OpenAI 谷歌 LLaMA

AI研习所 2024-07-22

英伟达Mistral炼出新模型：12B小杯、128k上下文，性能超过Llama 3 8B

智东西7月19日消息，昨日晚间，就在OpenAI推出GPT-4omini模型不久后，英伟达和法国明星AI独角兽Mistral也联合发布了名为MistralNeMo的小杯模型，旨在提供性能优越、部署便捷、安全性…

英伟达 OpenAI LLaMA

智东西 2024-07-25

支持多场景问诊国内首款大模型驱动AI医生发布

ChatGPT是一个交互式人工智能模型，在医学领域，ChatGPT可以用于辅助医生进行疾病诊断、医疗保健管理等方面。据报道，近日，互联网医院医联宣布成功研制国内首款大模型驱动的AI医生------medGPT，该产品目前已进入内部测试阶段，并计划于5月份正式发布。

ChatGPT 人工智能医疗

金融界 2023-05-04

vivo发布首款AI大模型手机

钛媒体App 11月13日消息，vivo正式发布首款AI大模型手机vivo X100系列，这是行业首批百亿大模型在终端调通的手机。据介绍，vivo X100系列搭载了蓝心大模型，这是vivo研发的通用

AI大模型

钛媒体快报 2023-11-13

AI视野：ChatGPT模型大更新；阿里云发布多模态大模型；

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。正交微调解锁文本创建逼真图像新能力实现对生成图像的精确控制【AiBase提要:】👉正交微调增强模型控制能力👉使用正交变换方法保持模型语义生成能力👉在生成质量和效率方面表现出色。

ChatGPT 人工智能

站长之家 2024-01-26

近期资讯

iPhone史诗级加强！iOS 18正式版发布：防晕车功能来了

快科技9月17日消息，今日，苹果面向iPhone用户推送iOS 18正式版更新，带来全新UI设计，并支持自定义桌面等多项新功能。据了解，iOS 18正式版还新增“车辆运动提示”功能，可帮助乘车

2024-09-17

《Nginx核心技术》第06章：按日期分割Nginx日志

用最简短的篇幅介绍Nginx最核心的知识，掌握如何按日期分割Nginx日志，并能够灵活运用到实际项目中，维护高可用系统。

冰_河 2024-09-17

RocketMQ发送消息之消息过滤

前言在前面的文章中，记录了RocketMQ消息广播，延迟消息等机制，今天介绍一下一个特别特别重要的功能---消息过滤。顾名思义，它可以让消费者根据特定条件选择性地接收消息，从而优化资源利用，提高系统

小威要向诸佬学习呀 2024-09-17

Web Workers多线程处理图片预加载

Web Workers script中的async和defer Web Workers可以为Web内容在后台线程中运行脚本提供了一种简单的方式,可以实现多线程.在进入到正文之前,我们先看一下这

Virtual09 2024-09-17

EA新战地细节

为了支撑股价，EA在投资者日前夕公布了正在开发的战地新作某些细节。首先，新战地将回归现代设定——为了避免不必要的麻烦，战场可能设定在欧洲地区，还构思了诸如舰对舰以及直升机

2024-09-17

如何解决服务器渲染SPA中的SEO问题？

什么是服务器端渲染服务器端渲染简称SSR(Server-Side Rendering),它是一种Web开发技术,它允许在服务端生成完整的HTML页面,并将其发送给客户端浏览器. SEO问题

Virtual09 2024-09-17

在数字马力工作的这五个月

一不小心已经入职数字马力五个多月了，作为往日的总结大师，来数马或许是我职业生涯的一个转折点，感觉还是有必要总结一下子的。

刘小灰 2024-09-17

10月1日国庆假期火车票今天开售：抢票认准12306官方平台

快科技9月17日消息，今天国庆10月1日火车票正式开始发售，官方提醒大家要认准12306官方平台购票。如果没抢到票要用官方的候补功能，第三方平台所谓加速包等方式都没有任何作用。目前候补功能

2024-09-17

这样设计系统，能拿下大厂的Offer吗？

在技术面试中，系统设计能力被认为是非常重要的一项技能，尤其是对于中高级工程师或架构师职位。这种能力不仅仅是编写代码的技巧，还涉及到解决复杂问题、设计高效和可扩展系统的能力。

猿java 2024-09-17

独立开发沉思录周刊：vol12.海上生明月，天涯共此镜

卷首语本周是中秋节，看到了一篇有意思的短篇科幻小说《故乡明》，非常契合中秋节的氛围故事开头的大致情节是人类在进行月球探测时，意外发现了在 40 年后将受到周期性伽马射线暴袭击的信息，并且经过论证后

两万焦 2024-09-17

Pixtral 12B 发布：Mistral 首款多模态 AI 大模型

推荐体验

相关资讯

Mistral联合英伟达开源12B小模型：碾压Llama 3，单张4090可跑

英伟达Mistral炼出新模型：12B小杯、128k上下文，性能超过Llama 3 8B

支持多场景问诊国内首款大模型驱动AI医生发布

vivo发布首款AI大模型手机

AI视野：ChatGPT模型大更新；阿里云发布多模态大模型；

近期资讯

iPhone史诗级加强！iOS 18正式版发布：防晕车功能来了

《Nginx核心技术》第06章：按日期分割Nginx日志

RocketMQ发送消息之消息过滤

Web Workers多线程处理图片预加载

EA新战地细节

如何解决服务器渲染SPA中的SEO问题？

在数字马力工作的这五个月

10月1日国庆假期火车票今天开售：抢票认准12306官方平台

这样设计系统，能拿下大厂的Offer吗？

独立开发沉思录周刊：vol12.海上生明月，天涯共此镜

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响