最近几个月来,似乎每个人都在日常生活中跟 ChatGPT、Bard 等 AI 机器人聊得热火朝天,让它们来帮忙写邮件、写总结、做计划。但有个普遍的现象是,一旦当人们切换到工作模式时,这些生成式 AI 工具便很少出现在大家的工作流程中,甚至被一些公司明令禁止。
AI 能力如此强大,为什么企业们不用?
这背后的核心原因其实很简单——每个企业的数据安全和隐私问题都太重要。没有企业敢把自己的 " 命脉 " 完完全全地交在还并未发展成熟、并由其他大型公司掌控的 AI 手上。
那么,是否有办法解决这个棘手的问题,进而在企业端最大化地发掘生成式 AI 的潜力呢?其实从 2019 年开始,就有一家名为 Cohere 的 AI 创业公司在密切关注这个问题并不断提出解决方案。
长期以来,企业级的生成式 AI 都是一个相对小众且壁垒较高的市场,但 Cohere 凭借着成熟的技术和敏锐的嗅觉得到了一众大佬和巨头的支持。目前Cohere 的投资者不仅包括英伟达、甲骨文、Salesforce 等巨头,同时还有图灵奖得主 Geoffrey Hinton、斯坦福 AI 教授李飞飞等一众圈内大佬。不久前,YouTube 的前首席财务官 Martin Kon 也选择加入 Cohere 担任总裁和首席运营官。
英伟达、甲骨文和 Salesforce 都在押注 Cohere,图片来自 Crunchbase
乘着 ChatGPT 爆火的东风,今年以来,Cohere 的潜力开始被越来越多的人的看到并进入了估值飙升的快车道,目前已成为全球 AIGC 赛道仅次于 OpenAI 和 Antropic 的第三大独角兽。
从谷歌 " 脱胎 ",来自加拿大顶级 AI 圈
Cohere 成立于加拿大多伦多,于 2019 年由 Aidan Gomez、Ivan Zhang 和 Nick Frosst 共同创立。三人本科都就读于多伦多大学计算机科学专业,按照入学时间推算,三人目前应该都未超过 30 岁。
Cohere 的创始团队,图片来自 Cohere 官网
其中,Aidan Gomez在 2017 年本科期间就参与了由谷歌大脑团队研究并作为署名者之一发表了名为《Attention is All You Need》的论文,而这篇论文就是日后大名鼎鼎的 Transformer 机器学习架构的开端,也是发展谷歌 BERT、OpenAI 的 GPT 等未来革命性架构的基石。
在同一年,Aidan Gomez 和同系的同学 Ivan Zhang 创立了一个非营利人工智能研究社区 For.ai,用以支持和链接世界各地的人工智能独立研究者。
本科毕业后,Aidan Gomez 前往牛津大学攻读计算机科学的博士学位,同时也加入了由 " 深度学习之父 "、图灵奖获得者 Geoffrey Hinton 领导的谷歌 AI 团队,基于 Transformer 架构进行进一步研究。在谷歌大脑的 Hinton 团队之中,Aidan Gomez 结识了一直从事机器学习和认知科学研究的 Nick Frosst。
在之后两年中,通过研究的深入,大家了解到 Transformer 可以扩展为性能出色的大型神经网络,并在语言相关的任务上表现十分出色。包括 Aidan Gomez 在内的一些 Transformer 论文撰写者们都开始思考这背后所蕴藏的商业化机会,目前除了 Llion Jones 仍在谷歌工作,其他七位作者都纷纷 " 下海 " 创业。
其中,Aidan Comez 则与 Nick Frosst 和 Ivan Zhang 共同创立了 Cohere。跟谷歌、微软等实力雄厚公司去重金训练大模型不同,在 2019 年 Cohere 成立开始,他们就专注于企业用例,试图根据不同企业的专有数据去创建定制化的大语言模型。
不靠云,要做企业定制生成式 AI 服务
简单来说,Cohere 的目标是要成为各类开发人员的默认 NLP 工具包,让各类开发人员都可以使用大型神经网络和最先进 AI 来解决任何语言相关问题,但却不依托于任何公共云,让模型能在私有云或本地部署中运行。
目前,Cohere 的主要产品主要围绕着企业日常运营中的三个关键领域:文本生成、文本分类和文本检索,几乎覆盖了企业生产中所有跟文字有关的领域。
文本生成部分主要有 Summarize、Generate、Command Model 三个产品。Summarize 是一个由大型语言模型驱动的文本摘要生成器,能快速概述和总结文档的关键点,可以支持输入 10 万个字符和文本格式选项。Generate 则是一个内容生成器,可以为各种目生成独特的内容,比如电子邮件和产品描述等。
下面,再重点介绍一下 Command Model。Command 是 Cohere 推出的一个能够接受用户个性化命令训练的文本生成模型。也就是说,企业用户在将自己的数据和 Command 结合之后,就可以产生一个自己独有的语言模型,能够在企业的实际业务中立即发挥作用。
Command Model,图片来自 Cohere
值得注意的是,作为一个只有 520 亿个参数的模型,Command 的准确性表现此前却超过了其他更大规模训练的模型,在不久前被斯坦福大学的语言模型全面评估(HELM)评为世界上最有能力的大型语言模型。
图片截自斯坦福大学的语言模型全面评估(HELM)官网
文本检索部分,包括 Embed、Semantic Search、Rerank 三个产品。
对于希望构建自己的文本分析应用程序的机器学习团队,Embed 可以帮助他们快速发现趋势,并支持 100 多种语言。Semantic Search 是一个强大的搜索工具,用户只需要简单使用 API,就可以使用该搜索功能,能够支持基于查询的含义而不仅仅是关键词来返回多种信息,并且不受语言的限制。Rerank 可以基于语义相关性分析现有工具的搜索结果并进行排名,从而提供更丰富、更相关的结果,且对用户的干预或编程经验要求很小。
文本分类部分主要产品为 Classify,该功能使用户能够个性化的组织信息来帮助内容审核、用户分析和进行聊天机器人体验。比如它能够通过快速标记不同类别的客户来进行高效的客户服务,也可以识别正面和负面的社交媒体评论来更好地了解客户的反馈等。
图片来自 Cohere
Cohere 的商业模式是先承担创建大型的 Transformer 神经网络的成本,然后再将有需求公司连接到这些网络,公司则按使用情况进行付费。Cohere 的主要特点是为客户提供了包括私有云、本地部署、Cohere 托管云和其他云伙伴 AWS、谷歌等多种数据托管选项,让用户根据自身需要进行选择,让客户对数据拥有控制权。
对于希望学习原型设计并成为社区一部分的开发者,Cohere 提供了免费的、限制使用率的使用。然而,如果希望进入生产、训练自定义模型、访问所有端点并接收增强的客户支持,将需要支付费用。目前 Cohere 的客户包括 Spotify、Jasper、HyperWrite 等。
从价格来看,嵌入功能下,默认模型每 100 万个 Token 40 美分,企业自定义的模型 80 美分,生成功能下,默认模型每 100 万个 Token 15 美元,自定义模型 30 美元,总结功能下,每 100 万个 Token15 美元等。
Cohere 不同功能的价格情况,图片来自 Cohere
不过,此前 Cohere 的这个定价还算很有优势,但在昨天 OpenAI 大降价之后,预计也会给 Cohere 带来不小的冲击。比如 OpenAI 的嵌入模型价格直接跳水 75%,每千 token 只需 0.0001 美金,也就是 1 美元一千万 token,远远低于 Cohere。
大佬和巨头力挺,Cohere 驶入 AIGC 第一阵营
瞄准企业级 AI 数据安全痛点的 Cohere,在当前的 AI 用户端厮杀中脱颖而出,包括 VC、科技巨头和人工智能领域的大佬们都给它投去了支持票。2021 年正式迈入商业化以来,Cohere 的估值也节节攀升,目前已达到约 22 亿美元,在 AIGC 赛道仅次于微软支持的 OpenAI 和谷歌支持的Anthropic。
在 Cohere 成立之初,它的人工智能学术色彩似乎更为浓郁。在 2021 年和 2022 年的 Cohere A 轮和 B 轮融资中,当时的 AIGC 赛道的投资还在寒冬中,有谁给 Cohere 投去了支持资金呢?在这两轮的投资列表中,我们都看到了以下几位 AI 大佬的身影。
图片来自 Crunchbase
除了几个创始人在多伦多直接跟随学习过的 " 深度学习之父 "、图灵奖得主 Geoffrey Hinton 之外,还包括斯坦福大学教授、视觉实验室负责人李飞飞,加州大学伯克利分校教授、伯克利人工智能实验室主任 Pieter Abbeel,多伦多大学教授、前 Uber 人驾驶汽车技术研究中心主任 Raquel Urtasun,个个都是人工智能领域的学术大咖。
而在本月初宣布的最新一轮融资中,在 AIGC 的热潮中,Cohere 也得到了更多领域内科技公司的关注。其中包括人工智能最强 " 军火商 " 英伟达以及云巨头 Salesforce 和甲骨文。目前的融资总额已经达到 4.39 亿美元。
Cohere 的迅速发展离不开深厚的技术背景和赛道选择。从大模型的角度来说,Cohere 目前可能并不是市场上最领先的,但他们敏锐地抓到了 AIGC 企业端应用的痛点,能够在首先满足企业安全性需求的前提下,再进一步的提供内容生成、摘要、搜索等领域的服务。
他们的商业模式使得大量公司能够在无需斥重金构建自己模型的情况下自定义地接入大型神经网络,并通过细分业务模块,让公司能根据使用情况来进行付费,从而达到一种双赢的状态。
从目前 Cohere 越来越高的热度和 OpenAI 最近大规模的降价和 API 升级来看,AIGC 的战火在用户端正在一路蔓延到企业战场。而届时,或许一场真正的 AI 生产力革命才会真正开始。
来源:品玩