蓝鲸新闻6月11日讯 (记者 朱俊熹)最近的AI圈绕不开一个关键词:搜索。
谷歌、腾讯、百度等科技巨头都加快了在AI搜索领域的布局,期望着能诞生出AI时代的下一个杀手级应用。但这些体量庞大的选手会发现,这条赛道上早已盘踞着几家活跃的初创企业。
在国外,AI搜索引擎初创企业Perplexity 4月被传正在进行新一轮至少2.5亿美元的融资,推高公司估值达到25亿至30亿美元。而国内,被称作“中国版Perplexity”的秘塔AI搜索也是一款不可忽视的黑马产品。
今年年初,AI公司秘塔科技推出了新的搜索引擎“秘塔AI搜索”,一经发布便获得了极高的热度,访问量增速甚至一度超过AI公司月之暗面旗下的明星产品Kimi。据AI产品评测平台AIwatch.ai,4月国内AI搜索应用的访问量激增,其中秘塔AI搜索以1009万排在总榜第四位,次于Kimi、文心一言及360 AI搜索。
一款高热度的AI搜索产品让更多人注意到秘塔科技,但这家公司实际上在人工智能领域布局已久。从早期专注于法律垂直领域的AI产品,秘塔正在转向更通用的应用场景。
不靠广告的AI搜索能盈利吗?
传统搜索引擎的诞生最早可追溯到近三十年前,如果说用户早已习惯在浩如烟海的信息和广告中自行寻找到解答,那么AI搜索提供的则是全然不同的体验——对网页内容进行总结,直接提供答案,还没有广告的干扰。
秘塔AI搜索也喊出了“没有广告,直达结果”的口号。传统搜索引擎的主要商业模式是通过广告向企业收费,而对用户免费。但AI搜索却允许用户跳过网页链接直接获取答案,这也让人们开始好奇这类搜索的商业化路径,毕竟背后的企业需要找到盈利方式,而如果引进了广告,对搜索体验又势必会造成影响。
走在AI搜索领域前列的Perplexity在商业化上的尝试或许能为国内外的同类选手们提供些参照。Perplexity由前OpenAI研究科学家Aravind Srinivas等人于2022年8月创办,到今年4月的月活跃用户已增长至1500万,就连英伟达CEO黄仁勋也表示“几乎每天都在用”。
作为挑战谷歌的新兴力量,Perplexity早期主打“不受广告驱动模式的影响”。其官网介绍称,这个平台希望能在时间宝贵的时代、信息过载的噪音中,提供精准且以用户为中心的答案。但现实显然改变了这一说法,要与广告保持距离的口号此前已在官方介绍中删除。创始人Aravind Srinivas在一个采访中表示,他并不反对在Perplexity上添加广告,希望能帮助广告商了解是谁在搜索,从而对高价值的流量竞价投放。
因此,Perplexity正走在融入广告的路上。其首席商务官Dmitry Shevelenko在4月透露称,公司计划首先在搜索结果中的“相关问题”部分引入原生广告,并在接下来的几个季度内推出这项广告业务。现阶段Perplexity的主要盈利方式是对高级功能收费,其基础版支持免费使用,如果用户想要享受更多功能,如选择不同的AI模型、无限制上传文件等,则需要支付每月20美元的费用。
而秘塔科技股东、猎豹移动的董事长兼CEO傅盛在科技媒体极客公园的访谈中提到,秘塔AI搜索未来有可能会采取复合的商业模式,向付费会员开放深度分析的功能。傅盛还指出,秘塔去年实现了盈利,在推出AI搜索产品时明确了要控制搜索成本不能过高的思路,采用的是大概百亿参数规模的自训大模型。
相较而言,Perplexity调用的GPT-4模型参数量达万亿级别,参数量越大也会带来更高的计算成本。据中金公司测算,Perplexity调用Bing搜索引擎及GPT-4的单个问题成本约为0.03美元,年成本约为6000万美元。
秘塔AI搜索利用的是秘塔科技自主研发的大模型MetaLLM。据秘塔科技介绍,该模型基于Transformer底层架构投入中文语料训练,因此产品更符合中文文本习惯。秘塔AI搜索还使用了混合专家模型(MoEs),使其预训练速度、推理速度能更快。
让AI搜索不同于ChatGPT的在于其所使用的检索增强生成(RAG)技术,这项核心技术支持大模型与外部数据库相连,基于检索到的内容生成答案,能够减少幻觉的产生。如果把用RAG的AI模型比作是在开卷考试,那么ChatGPT则是闭卷考试,不断地将更多数据喂给大模型训练,完全依靠内部数据生成回答。
当科技巨头们花费重金来卷大模型的性能时,Perplexity却没有挤进这场竞争里。业界将其视作“套壳产品”,因为它接入的是GPT、Claude等其他公司的模型,在Meta和Mistral AI发布开源模型后才开始训练自有模型。而管理层们显然有自己的逻辑,Aravind Srinivas直言,“如果你的目标是打造以产品为核心的公司,就不要在训练自有模型上浪费时间。成为一个拥有十万用户的套壳产品显然比拥有自有模型却没有用户更有意义。”
在是否要追赶更大参数的AI模型上,秘塔科技持有相似的谨慎态度。其创始人兼CEO闵可锐曾对媒体表示,底层技术是秘塔一定会去不断投入的方向,但是否需要千亿模型却不一定。在效果接近的前提下,“我们会希望它(模型)越小越好,而不是越大越好,因为后者会带来更大的成本。”他解释道。
比起全力投入到大模型的研发中,秘塔科技更注重在用户增长层面发力。在去年一档综艺节目中,秘塔科技的首席运营官王益为透露,公司每个月的支出里,一半是固定成本,另一半都由运营团队花费,每个月的运营预算达百万。该团队负责的是用户的增长,包括自制内容和外部投放,在抖音、B站、小红书等平台与一些博主达人进行合作。
这一策略是有效的。2022年秘塔科技产品的用户规模约在100万,到2023年就到了千万级别。秘塔会从C端注册用户中找到B端的销售线索,通过员工影响他们的领导层,自下而上地触达企业客户。
从法律垂直领域起家
事实上,在发布AI搜索产品之前,秘塔科技就已经推出了一款逻辑相似的产品——MetaLaw类案检索。用户在对话框中用自然语言提出法律问题,MetaLaw直接返回结论,并列出引用的案例和法律资料。
江苏剑桥颐华律师事务所律师、专利代理师杨卫薪告诉蓝鲸新闻,通用类的AI搜索对法律词汇的语义理解可能会存在问题,导致生成的答案也出现错误,而MetaLaw针对的就是专业的法律场景,在体验上效果更优。
“MetaLaw给我们减轻了不少的负担。一个简单的法律问题抛进去,就能得到不错的结论,后面还附有案例库,能够作为精确的支撑,让我们拿去回答客户。”杨卫薪表示。他补充道,虽然中国大陆地区采用的是以成文法典为中心的大陆法系,但类案在司法中也具有效力,能够为法官提供裁判参考,所以类案检索是有可用价值的。
杨卫薪回想起接触秘塔产品的契机,是在B站上看到了博主“@王一快”的推荐视频。而这位有着近60万粉丝、超4700万播放量的博主,正是秘塔科技的首席运营官王益为。他拥有法律行业从业经验,具备中国和美国律师执业资格,曾担任10年红圈所律师。秘塔创始团队的背景还覆盖了计算机工程、人工智能等行业,CEO闵可锐曾在微软和谷歌进行研究工作。
秘塔科技最早主攻的就是法律这条细分赛道。2019年,成立一年的秘塔科技推出了首款产品“秘塔翻译”,主打法律、公文类文书的中英文AI翻译。客户囊括了国内顶尖律师事务所、仲裁中心等法律相关机构。
闵可锐在接受媒体采访时解释称,之所以选择从法律切入,是因为这个领域具备付费的意愿与能力。负责跨国交易的律师可能需要耗费大量时间在翻译和校对的工作上,这是能被人工智能替代的点。律所愿意付费,专职的翻译团队开价又较高,于是促成了秘塔将第一个产品的落地定位确定为法律翻译。
“越来越多的法律实务都已经开始采用AI加持。我们看到的领域至少包括:法律检索、合同自动审阅、机器翻译、文书自动生成、案件辅助分析审判等。”闵可锐在2019年曾表示。
这是在新一轮人工智能浪潮来临前。
2022年OpenAI的ChatGPT横空出世后,AI+法律领域的初创企业们更是活跃了起来,包括幂律智能、华宇元典、得理科技等。其中,幂律智能在去年年底完成了近8000万元Pre-B轮融资,由蓝驰创投领投,投资者包括红杉中国、智谱AI等。该公司还联合智谱AI推出了法律垂直大模型。
秘塔科技也开始将目光从法律赛道投向更为广泛的通用领域。以秘塔旗下的另一款产品秘塔写作猫为例,2020年时它的定位还是“法律文本智能校对工具”,现在已更新为“文书写作助手”,提供智能写作、文本校对、改写润色等功能,用户群体也扩大至学生、新媒体等重度文字工作者。
法律垂类的场景和市场规模毕竟有限,当秘塔拥有了跳出来的技术基础,拓展原有业务就变得水到渠成,于是面向更多受众的秘塔AI搜索便应运而生。
但是想真正成为“中国版Perplexity”,既要面对来自搜索大厂、明星AI初创公司们的高压竞争,又要摸索出属于AI搜索产品的商业模式,秘塔科技要做的事还有很多。