综合能力提升20.3%！豆包大模型“秀肌肉”

作者：IT时报发布时间：2024-08-30

IT时报记者潘少颖

在享用了一顿美味的海底捞火锅之后，吃货小艺一如既往地留下了服务评价，“锅底香气浓，食材新鲜，牛肉片的口味可以更丰富一些，加汤、换碟都非常及时……”

每天，这样的顾客反馈不断“喂”到海底捞系统中，通过字节跳动自研大模型——豆包迅速分析和整理，精准提取出每一条评价中的关键信息，将顾客对锅底、食材、服务等意见分类汇总。

提升顾客满意度，是海底捞的“肌肉记忆”，在生成式大模型落地时，首要任务也是帮助海底捞“抓住顾客的心”。此前海底捞要安排专人对评价进行分析总结，在豆包大模型的加持下，实现了特定人群的食材推荐以及服务流程的智能化优化，在餐后评价分析场景中，提高数据处理效率，降低人力成本。无论是一百封、一千封还是一万封评价，皆能汇聚成极为详细的店铺服务质量报告。

8月21日举行的火山引擎AI创新巡展（上海站）上，火山引擎发布了豆包大模型的一系列产品升级。

通过字节跳动内部50+业务场景的实践验证、每日数千亿Tokens大使用量、提供多模态能力……最新版的豆包大模型秀了一把“肌肉”。“最新版豆包大语言模型的综合能力相比三个月前首次发布时提升了20.3%，已在智源、上海AI Lab等权威机构的多项评测中排名国产第一。豆包语音识别、语音合成等模型也有大幅升级，提供更顺畅、自然的交互体验。”火山引擎总裁谭待表示。

日均使用量突破5000亿Tokens

QuestMobile报告显示，基于豆包大模型打造的豆包App在同类产品中遥遥领先，月活用户数在上半年已达到2752万，是第二名的2.43倍。

效果不好、成本太贵、落地太难是大模型在业务场景落地中的关键挑战，“使用量高才能打磨好模型，好模型又会吸引更多人使用。”谭待介绍，今年5月，豆包大模型正式发布后，企业客户数、使用量均呈现爆发式增长，截至7月，整体日均使用量已突破5000亿Tokens，这个数字仍在快速攀升。

基于内外客户广泛、真实的业务需求，豆包在关键能力上不断迭代优化。根据公开评测集和字节内部评测集的测试，新版豆包大语言模型的角色扮演能力相比发布初期提升38.3%，具备了更强的上下文感知，让对话情境更连贯、角色更拟人化。在语言理解方面，豆包大模型的信息分类和抽取、总结摘要、阅读理解和问答等方面提升幅度也高达33.3%，还支持一个模型识别多种方言，包括上海话、粤语、四川话等。即使是一段在嘈杂环境中录制的方言，豆包也能迅速准确识别。

此外，豆包在长文任务、数学、专业知识、代码能力上也有不同程度的增强，综合测试成绩提高20.3%。

《IT时报》记者在现场了解到，豆包的图像模型，如图生图模型、文生图模型都“进化”不少，图生图模型可以让图片变化50余种不同风格，甚至还可以进行符合逻辑的图片延展、局部重绘、涂抹等行为。

豆包大模型团队在人才、资源上重度投入，为模型升级提供技术支撑。以语音技术为例，豆包大模型团队发表的Seed-ASR、Seed-TTS研究成果获得学术界广泛认可，成功应用于豆包语音识别模型和语音合成模型。在语音模型能力基础上，火山引擎整合了实时音视频技术，让AI语音交互能像人类说话一样打断和插话，端到端延时可低至1秒以内。即使在弱网环境，丢包80%依然可保持清晰流畅。

半数企业拥抱大模型应用

咨询机构 Rolling AI 与InfoQ、火山引擎联合发布的《生成式AI场景落地白皮书》显示，超过半数的企业在调研中积极拥抱大模型应用：小范围试点占比21.0%，大范围推广占比26.3%，将其整合到企业整体战略转型的比例达6.4%。

除模型效果外，落地难度也是企业应用大模型的重要考量之一，企业通常需要将大模型能力与业务场景需求进行适配。在谭待看来，大模型应用落地不仅需要技术成熟度，还要有适配的商业组织和商业生态。

为此，火山引擎与商超、餐饮、食品、服装等众多领军企业合作，成立零售大模型生态联盟，以AI交互为核心，重新定义购买、体验、产品、供应链等环节，增强零售业周转效率，提升消费者购物体验。联盟首批成员包括物美集团、抖音电商、抖音生活服务、百胜、麦当劳、中国飞鹤等。

销售和营销是当前中国企业大模型应用落地的最热门领域。物美集团的每日鲜商品是每天只卖当天库存的业务模式，旨在为顾客提供新鲜食材，但背后的问题是每天没销售完的商品只能做损耗处理，因此，晚场时要对库存较多的商品打折出清。

“原来的出清方案都是人工操作，方案比较随性。本来可以正价销售的商品，也被折扣销售。”多点DMALL创始人、物美集团创始人张文中表示，豆包大模型给出的出清方案更加科学精准，对于那些即将面临出清的商品，豆包大模型会综合考虑商品的属性、库存情况、销售历史等多方面因素，制定最合理的出清策略，避免人工操作中可能出现的盲目性和主观性错误，最大程度地减少不必要的损失。

“每品每次出清用豆包大模型的成本低于0.2元，可以带来50元～100元的增长。”降低企业成本，是当下零售企业拥抱AI的最好选择。张文中说，全面拥抱AI不仅是为了更好的未来，更是为了生存。

“卷”朋友圈 “卷”价格

豆包大模型的“朋友圈”正不断扩大，此前，火山引擎已分别与智能终端和汽车行业的众多企业合作发起大模型联盟，推动大模型在各行业应用场景创新。汽车大模型生态联盟如今又迎来了第二批成员单位加入，包括领克汽车、吉利银河、几何汽车、上汽荣威、上汽名爵等厂商。

吉利汽车集团营销数字中心负责人沈稳杰介绍，在豆包大模型帮助下，领克汽车实现了智慧邀约坐席、AI 对练&内训、AI 销售助手、智慧经营报表以及AI用车说明书等多项基于模型能力的功能，以大模型为销售顾问提供实时数据分析、客户行为预测、客户对练和评价总结以及个性化销售策略建议等服务，全面提升了销售能力。

捷途汽车和豆包大模型打造了“AI小捷”智能客服，通过自动化处理能力，大幅减轻员工的工作负担，“AI小捷”并且能精确锁定目标用户群体，实现营销信息精准投放。

在教育、金融、游戏等行业，大模型应用也取得积极进展。浙江大学求是特聘教授、信息技术中心主任陈文智介绍，在自研OpenBuddy模型以及豆包大模型的共同赋能下，浙大创建了“浙大先生”智能体应用开发平台，并搭建了AI科学家、慧学外语、AI百事通、数字教师等多个大模型校园应用场景。

不断变多的场景×更深的渗透率×敏捷迭代不断尝试=巨大用量和成本负担，大模型也在“卷”价格，

“在各家大模型最强版本价格对比中，豆包大模型比行业价格低98%以上。” 火山引擎智能算法负责人吴迪表露，“更强模型、更低价格、更易落地”是火山引擎提供的全栈AI解决方案的目标。以豆包通用模型Pro 32k为例，模型推理输入价格为0.0008元/千Tokens，即1元钱能买到豆包主力模型的125万Tokens，约200万个汉字，而市面上同规格模型的定价一般为0.12元/千Tokens。