ChatGPT 发布近两年后,全球掀起了一场大模型竞赛,如今怎么将大模型落地,成为萦绕在每一家 AI 公司的最大命题。
最近有媒体统计,自从 GPT-3.5 上线以来,中国新成立的 AI 公司已经有近 8 万家陷入注销、吊销或停业异常的状态。百模大战的热闹和惨烈都出乎很多人的意料。
最近火山引擎在 2024 AI 创新巡展上海站上,就交出了一份大模型与行业结合的答卷。
根据火山引擎在公布的最新数据,截至 2024 年 7 月,豆包大模型日均 Tokens 使用量超过 5000 亿。发布 2 个月以来,平均每家企业客户日均 Tokens 使用量增长了 22 倍。
豆包大模型获得众多行业客户青睐。火山引擎总裁谭待表示,而在这两个月的快速增长中,涨得比较快的客户是社交类、游戏类等 C 端应用,时长非常高,而 B 端的增长主要集中在头部客户。
火山引擎也公布豆包多个豆包垂类模型的最新升级。最新版豆包大语言模型的综合能力相比三个月前首次发布时提升了20.3%。
其中豆包·文生图模型对长文本有更精准的图文匹配能力,画手等复杂场景驾驭能力更强了,也更擅长理解中国元素来创作。
而豆包·语音识别模型也提升了语音识别准确性在多个公开测试集中,与国内公开发布的语音识别大模型相比,错误率最高降低40%,还支持粤语、上海话、四川话、西安话、闽南语等方言。
豆包在不久前也开始支持实时语音通话,基于豆包大模型和实时音视频(RTC)技术,提供端到端的大模型实时对话方案。
用户不仅能用语音与 AI 进行交谈,还能像平时说话一样,在对话过程中适时打断或插话,端到端延时可低至1秒以内。即使在弱网环境,丢包80%依然可保持清晰流畅。
同时经过升级后的 AI 声音具备较好表现力和感情色彩,对话更自然、更真实、更流畅,让大模型交互体验更强。
根据咨询机构 Rolling AI 与InfoQ、火山引擎联合发布的《生成式AI场景落地白皮书》,超过半数的企业在调研中积极拥抱大模型应用,其中销售和营销是当前中国企业大模型应用落地的最热门领域。
火山引擎也在现场宣布携手多点 DMALL 成立零售大模型生态联盟,基于豆包大模型打造零售AI解决方案,重新定义购买、体验、产品、供应链等环节,增强零售业周转效率,提升消费者购物体验。
谭待认为,大模型应用落地不仅需要技术成熟度,还要有适配的商业组织和商业生态。在落地上则会优先结合数字化程度高、数据多等对云和对AI 来说都是更容易落地的场景。
这次选零售也是觉得零售覆盖的人和数据是足够多的,这里面我们认为也能够产生很大的变化,而且相当于终端来说又有很大的行业的壁垒和know-how,那也是值得创新的。
得益于字节系的用户流量,豆包在推出不久后就成为了中国最大的 AIGC 应用之一。在 a16z 最新发布的全球Top 100 AI 应用榜单中,豆包也首次进入榜单。
谭待在接受采访时也表示,云的本质是规模经济,规模大就有竞争力,弹性也会更好,成本也会更低。这也组成火山引擎和豆包模型在当下 AI 浪潮中的核心竞争力:
一是模型越来越好(更强模型),我们有信心很重要的原因C、B端联动,也能服务越来越多的用户,应用最大的调动量。
二是成本,当然现在成本不是一个卡点,在我们现在的成本下大家都很放心地使用,我们要做好的是加量不加价,同样的成本下把能力提升。我们现在的版本,比两个月以前的版本提升了20%,价格是没有变的,这个帮大家解决了很多问题。
三是落地容易性,除了大模型之外我们有扣子专业版、Hi Agent,帮企业更好地应用开发他自己的Agent,我们也通过联盟的方式和行业重要的有 know-how 的伙伴结合,通过联盟加速行业 AI 转型的速度。
大模型的格局尚不清晰,一个超级应用何时出现难以预测,但以能力更强、价格更低和更易落地的大模型与行业融合,或许将能加速大模型商业化的探索,也能从中找到更多 AIGC 的 PMF(产品市场契合度)的可能性。
Google 前 CEO Eric Schmidt 不久前在一次分享中提到,目前大家都还只是在摘取「低垂的果实」,需要组织创新,才能真正拿到巨大的回报。
在这件事上,火山引擎的行动显得更加务实,谭待表示:
我觉得低垂的果实可能 10%都不到,特别是在中国可能是 5%,我感觉第一步先把低垂的果实摘完,摘着摘着慢慢积累得越来越多可以够得更高,吃得更多就涨得更高,所以我还是偏务实,技术创新还是要服务商业本质,现在能把该拿的收益拿到就已经很有价值了。