杀疯了！豆包发布视觉理解大模型，又把价格打骨折

作者：AppSo发布时间：2024-12-19

都说 AI 还在等待超级应用，或许月活接近 6 亿的 ChatGPT 在某种程度上已经是了。

而在国内月活超过千万的 AI 应用也屈指可数，其中用户量最大的就是豆包，月活达到 5998 万，仅次于 ChatGPT 位列全球第二，年底 1 亿月活的目标也似乎不是遥不可及。

今天豆包又迎来了一个重磅更新， 视觉理解模型正式发布。

我们在今年的 GPT-4o、Google 的 Project Astra，以及 iPhone 16 和一众旗舰机型上都看到了视觉理解模型在加速落地，让多模态交互降低用户的使用门槛，辅助完成一系列复杂的任务。

那么豆包的视觉理解模型有什么不同？在看完发布会和简单实测后，我发现这个模型有这几个特点：

细致入微的视觉描述和创作能力

还有一个我旅行时很爱用的功能，只要拍下一个建筑，它就能给你介绍这背后的历史和各种细节。

而在推理能力，在 o1 推出后，这也成为各种模型的大考。

豆包这次将推理能力到视觉理解模型中，在解答微积分题和今年的高考物理题时可以看到，豆包视觉理解模型都能正确理解题意，并根据提示给出清晰解题思路。

豆包甚至还能出类似知识点给你出新的练习题，可以说是家长辅导作业的神器。

对于内容创作需求，豆包也有了提升。比如随手画一幅涂鸦，就能让它编写一个故事。

结合视觉理解模型，豆包这些 AI 创作功能也有了更多可玩性，比如根据一张风景照让豆包作一首诗，然后将诗句创作成海报。

在现场，字节还放出了一个更重磅的消息，将豆包视觉理解的价格打到了每千 tokens 0.003 元，相当于一块钱可以处理 284 张 720P 的图片。

视觉理解模型都以厘定价了，这在如今大模型中到底多炸裂？

GPT-4o 128k 的价格是每千 Tokens 一分七厘。阿里的qwen-vl-max 32k 是 2 分钱，豆包比行业平均价格降低 85%，打了个骨折。

在今年国产大模型掀起的价格战中，字节手持的屠刀也越来越大。

5 月份豆包将通用模型 pro-32k 版的价格定在0.0008元/千 tokens，比行业均价低 99.3%，花一元钱就能让豆包处理 200 万个汉字，相当于三本《三国演义》，让行业其他玩家不得不跟进。

关注 AI 第一新媒体，率先获取 AI 前沿资讯和洞察

快速的模型迭代，丰富的应用生态和激进的定价，共同助推了豆包的高速增长。

火山引擎总裁谭待表示，截止到上周日，12 月 15 号，豆包大模型的日均 tokens 数已经突破了 4 万亿， 在 7 个月的时间里增长超过 33 倍。

据不完全统计字节今年发布的 AI 应用就有接近 20 款，基本覆盖了图像、语音、音乐、视频、3D 等主流的模态和场景，还推出了 AI 耳机 Ola Friend 等硬件产品。

以 App 工厂闻名的字节，似乎要将这个策略沿用到这场 AI 新浪潮中。

既然没有人能笃定什么是 AI 杀手级场景，那么就用饱和式打法，这也让字节成为 AI 军火库中最为齐全的一家科技公司。

在大模型从快速扩张进入到淘汰赛的阶段，以字节的财务状况和算力资源，也让它可以采用 AI 几小龙无法做到的打法，来打造下一个爆款 AI 应用。

据悉在字节内部，已经提升了即梦的优先级，希望通过新的路径塑造「AI 时代的抖音」，而即梦的负责人，也是 0 到 1 打造出抖音的张楠。

今天张楠在发布会上表示，抖音是一个「真实世界」的相机，而即梦希望借助 GenAI 技术成为想象力世界的相机，也可见字节对于即梦的期待值有多高。

不过被寄予这一厚望的字节产品，恐怕也不会只有一款。

相关资讯

杀疯了！字节豆包视觉理解模型价格下降85%，火山引擎谭待：现在不太关注市场竞争

（图片来源：钛媒体AGI编辑林志佳拍摄）字节跳动的豆包大模型及相关产品超出预期的表现持续引发行业关注

AGI 字节跳动

钛媒体 2024-12-18

豆包视觉理解模型正式发布，价格进入“厘时代”

豆包大模型多款产品也迎来重要更新：豆包通用模型pro已全面对齐GPT-4o，使用价格仅为后者的1/8；音乐模型从生成60秒的简单结构，升级到生成3分钟的完整作品；文生图模型2.1版本，更是在业界首次实现精准生…

数科社 2024-12-19

豆包发布视觉理解模型比行业价格便宜85%

图：火山引擎总裁谭待此外，豆包大模型多款产品也迎来重要更新，据现场披露，豆包通用模型pro已全面对齐GPT-4o，使用价格仅为后者的1/8；音乐模型从生成60秒的简单结构，升级到生成3分钟的完整作品；文生图模…

和讯网 2024-12-18

豆包视觉理解模型正式发布，比行业价格便宜85%

继大语言模型价格以厘计算之后，视觉理解模型也宣告进入“厘时代”。在12月18日举办的火山引擎Force大会上，字节跳动正式发布豆包视觉理解模型，为企业提供极具性价比的多模态大模型能力。

大语言模型字节跳动

封面新闻 2024-12-18

杀疯了！字节豆包视觉理解模型价格下降85%，火山引擎谭待：现在不太关注市场竞争｜钛媒体AGI

钛媒体AGI获悉，12月18日火山引擎Force大会上，字节跳动正式发布豆包视觉理解模型、豆包3D生成模型，以及全面更新的豆包通用模型pro、音乐模型、文生图模型等，为企业提供多模态大模型能力。同时，过去一年…

AGI 字节跳动

钛媒体APP 2024-12-19

近期资讯

超好用的按模板导出word（一）

“poi-tl（poi template language）是Word模板引擎，使用模板和数据创建很棒的Word文档。”“在文档的任何地方做任何事情（Do Anything Anywhere）是poi

小尘哥 2024-12-27

人生苦短，我用Python学AI：编程语法与智能的交响曲

人生苦短，我用Python学AI：编程语法与智能的交响曲引言在这个信息爆炸的时代，我们常常感叹“人生苦短”。时间，这个宝贵的资源，似乎总是在不经意间从指尖溜走。在这样的背景下，我选择了一条既充满挑

JoyRider 2024-12-27

从刀耕火⛏️种到现代化🚀：前端开发的进化与Vue哲学🤔

前言在学习了好几天VUE后，我觉得它不仅仅是一个技术框架，更是一种前端开发的哲学思想。深入探索Vue的设计理念和架构决策，我发现许多值得学习和借鉴的哲学思想。这些思想不仅影响着Vue本身的发展，也指

狂炫一碗大米饭 2024-12-27

functools.lru_cache 函数值缓存工具

functools.lru_cache是Python的标准库functools提供的一个功能强大的内置缓存装饰器，LRU代表Least Recently Used（最近最少使用），如果缓存容量满了，基

随便写写 2024-12-27

pyenv-win: Windows上的 Python 版本管理工具

pyenv-win 工具的安装和基本使用介绍，一种类似前端 nvm 的 python 版本管理工具。

四棱子 2024-12-27

一起来看看响应式会话存储的实现原理

前言在日常开发中，我们总会遇到组件或者工具函数复用的问题，如果使用的是相关框架，例如vue/react，则还会遇到公共hooks的复用问题。如果我们将这些公共的函数封装出来，然后发布成一个npm包，

夕水 2024-12-26

《C++ Primer》第六章：函数

第六章：函数 0.前导：由多条语句组成的有自身作用域的代码块就是函数，它可以被反复调用。学习路径：函数组成——参数传递——返回类型——重载——函数指针总结：在学习完本章函数后，我明白了：参数的传

夜阳朔 2024-12-27

GitHub 上排名前 11 的开源管理后台（Admin Dashboard）项目

介绍了 GitHub 上排名前 11 的开源管理后台项目，涵盖了从基础模板到功能强大的平台，帮助开发者快速搭建灵活且高效的管理后台。探索这些开源项目，提升你的开发效率，满足不同场景的管理需求。

NocoBase 2024-12-27

Java 面向对象的理解

一、面向过程编程（Procedural Programming）面向过程编程是一种编程范式，它将程序看作一系列按顺序执行的步骤或过程。在这种编程方式中，程序的核心是函数或过程，数据通常存储在全局变量

简单的东西为什么越来越复杂 2024-12-27

《Move 学习》- 包与 Manifest 文件

深入理解 Move 包的结构和 Manifest 文件的配置，掌握模块依赖管理和包发布的核心概念

链上码农 2024-12-27

杀疯了！豆包发布视觉理解大模型，又把价格打骨折

推荐体验

相关资讯

杀疯了！字节豆包视觉理解模型价格下降85%，火山引擎谭待：现在不太关注市场竞争

豆包视觉理解模型正式发布，价格进入“厘时代”

豆包发布视觉理解模型比行业价格便宜85%

豆包视觉理解模型正式发布，比行业价格便宜85%

杀疯了！字节豆包视觉理解模型价格下降85%，火山引擎谭待：现在不太关注市场竞争｜钛媒体AGI

近期资讯

超好用的按模板导出word（一）

人生苦短，我用Python学AI：编程语法与智能的交响曲

从刀耕火⛏️种到现代化🚀：前端开发的进化与Vue哲学🤔

functools.lru_cache 函数值缓存工具

pyenv-win: Windows上的 Python 版本管理工具

一起来看看响应式会话存储的实现原理

《C++ Primer》第六章：函数

GitHub 上排名前 11 的开源管理后台（Admin Dashboard）项目

Java 面向对象的理解

《Move 学习》- 包与 Manifest 文件

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响