当前位置:首页|资讯|生成式AI

小i机器人:中国式AI力量,探索场景商业化之路

作者:阿尔法工场研究院发布时间:2023-03-27

原标题:小i机器人:中国式AI力量,探索场景商业化之路

大语言模型底层技术突破,为中国智能交互机器人带来划时代机遇。

3月24日,OpenAI新动态再次引发市场热议。OpenAI宣布ChatGPT将支持第三方插件,以访问更多信息,以及增加相应的功能。

从国内外互联网巨头纷纷推出“自家的ChatGPT”产品,到微软旗下多款产品宣布结合ChatGPT技术。一连数日,ChatGPT热度居高不下,其身后的生成式AI技术和大语言模型技术也逐渐浮出水面,备受关注。

本质上,生成式AI(Generative AI)是一种深度学习模型,由生成器负责生成内容,判别器负责判别源数据和生产内容之间的差别并提供反馈。

大型语言模型(Large Language Models,LLMs)则是在生成式AI之上,通过对大规模语料库的学习,来理解人类语言的问题和答案之间的关系。

大型语言模型与以往的语言模型最大的不同,在于其拥有“涌现能力”(Emergent Ability)。

涌现能力是指,在模型规模超过某个阈值之后,模型性能会打破之前线性增长的规律,实现跃升式突变。简单地说,就是实现“质的飞跃”。

线性增长(左)与打破阈值后的突变(右),来源:知乎

而“大规模”就是实现这一质变的关键因素,这通常意味着百亿或千亿级的参数量。

而大型语言模型带来的突破,最直接影响的行业,就是智能交互机器人。

01 大型语言模型:智能交互机器人的新里程碑

智能交互机器人,也就是我们通常所说的“聊天机器人”,可以通过和人类交流,提供相应的回答和服务。

智能交互机器人按其设计目的划分,一般分为信息型、任务型、对话型等三种类型。

信息型聊天机器人提供特定领域的知识或信息,任务型聊天机器人帮助用户完成某些特定任务,对话型聊天机器人则能够与用户闲聊或娱乐。

无论输出内容还是服务,如何在输入阶段就能准确理解甚至“思考”人类语言意图,是所有智能交互机器人产品的核心技术问题。

在智能交互机器人的第一阶段,基于规则的专家系统和机器学习的结合,被认为是行之有效的技术方案。由此,机器第一次实现了对人类语言的“理解“。早在2004年,小i机器人(AIXI.US)推出的Chatbot,正是国内最早应用这一技术的产品。

小i机器人早期产品,来源:Lofter

这一阶段,机器理解能力的灵活度相对有限,有时需要用户去“迁就”机器所能识别的语义逻辑。如果表达的方式不对,便会带来交流障碍。

为了解决这一问题,包括小i机器人在内的许多开发者,都选择引入深度学习技术和预训练模型——这是智能交互机器人技术的第二阶段。大量的数据和训练,使机器开始能够自动识别和理解人类语言,对话的自然度得到了大幅提升。

如今,大模型时代,智能交互机器人迈入第三阶段。

与此同时,人们对智能交互机器人的要求也早已不限于“一问一答”。

在进行更自然、流畅、连贯和有逻辑性的对话、这一“智能化”基础需求之上,根据用户的语境、情感和偏好提供服务的“个性化”需求,以及支持图形、声音、视频等多种媒体形式的“多模态”互动需求,都已成为聊天机器人不可缺少的功能。

高频需求场景切换,促使智能交互机器人有望从娱乐工具变成提升效率的生产力工具。正如ChatGPT推出之初,很多博主用它来写段子吸引流量,直到微软将其与Office产品结合,才让“打工人”由衷感到切实震撼。

技术进步切入工作和生活场景,进而转化为生产力提升,才是用户真正关注和愿意为其买单的关键。

来源:微信

在此背景下,专业化、垂直化和场景化成为了智能交互的下一个新命题,也是新趋势。

很快,曾经的聊天机器人,将被用来应用在不同行业和领域,提供专业化和垂直化的解决方案。

特定领域知识库和数据集,也将进一步训练和微调,以提高对话质量和准确性。同时,智能交互机器人还能根据不同场景提供定制化的功能和服务,满足用户在教育、医疗、金融、旅游等各个方面的需求。

大语言模型带来的,正是支撑这些新需求趋势的技术基础。

02 场景和数据打开巨量市场

据弗若斯特沙利文,2017年至2021年中国人工智能市场规模由545亿元增长至2607亿元,年复合增长率达47.9%。

ChatGPT所运用的生成式AI技术,被Gartner列为最有商业前景的人工智能技术,预计在2年-5年内进入成熟期。智能交互机器人所运用的对话式AI技术,可被视作生成式AI技术的一种。

同据弗若斯特沙利文,2021年中国对话式AI市场规模为82.7亿元,2026年预计达265.8亿元,年复合增长率26.3%。

其中,B端垂直领域应用被认为是主要的增长潜力来源。

来源:弗若斯特沙利文

深挖垂直领域应用是行业的共识。360公司创始人、董事长兼CEO周鸿祎在一次访谈中提到,OpenAI找了1000家垂直的SaaS公司,将专门训练垂直领域应用。

早在智能交互机器人的第一和第二阶段,深挖B端垂直领域就已被证明是成功的商业化路径。

2011年,当Siri还只是作为iPhone配套的新功能刚刚推出时,小i的聊天机器人已经转型B端业务,获得了金融、通信等诸多行业巨头的订单,直接贡献了营收的增长。

来源:小i机器人官网

基于本轮大语言模型的技术突破,商业化比拼的仍旧是场景和数据,而不是算力。

以ChatGPT为例,许多用户都感受到中文回答相较英文更有局限性。这是因为其训练数据主要运用的是英文。

中国电子银行网文章提到,“RLHF论文中的训练数据英文占比99%+,西、法、德语还占了剩下的大部分,中文估计就是0.0x%这个级别。“

想在中国将大语言模型带来的进步充分发挥,必须拥有对中文使用场景的深刻理解,以及累积出丰富的中文数据集。

然而,相对于英文数据,中文大语言模型的数据集是极其稀缺的。

中文数据在互联网的开源程度较低,数据规模相对较小,且数据质量参差不齐,高质量的无监督语料和指令数据严重不足。并且,垂直细分领域的数据集的获得难度更大,鲜有公开数据,数据积累需要较长的周期。

因此,早已深耕在中文智能交互机器人领域的头部公司,将是智能交互商业化时代最有潜力的先行者。

03 新一轮技术突破红利

拥有20余年积累的庞大中文语料库的小i机器人,拥有这一竞争中最重要的资源。

小i机器人成立于2001年,拥有自主研发的智能交互机器人知识产权,专注于以自然语言处理为基础的认知智能相关技术的产业化落地。

2023年3月9日,小i机器人在纳斯达克上市。

来源:小i机器人官网

语料资源对B端垂直领域尤为重要。对于特定行业来说,通过特定领域的数据集训练,并结合基于人类反馈的强化学习,大型语言模型将在特定行业和领域得到更广泛的应用。

多年深耕,令小i机器人在多个垂直领域积累沉淀了海量的知识库和语义库,具有将特定行业语料与大语言模型相结合的丰富经验和技术优势。

商业化落地能力,是小i机器人的另一优势。

AI行业参与者往往重研发、重烧钱而缺乏落地经验。但是,小i机器人最早将人机交互技术引入了大规模商用。小 i 机器人协助银行打造的虚拟客户助手,作为典型案例得到Gartner推荐。

智能对话机器人银行客户案例,来源:小i机器人

目前,小i机器人的客户已涵盖近千家企业及政府机构。客户名单包括三大电信运营商,交通银行、建设银行、浦发银行等金融机构,华为、小米、东方航空、通用汽车等大型企业。

大语言模型的技术突破,也正是小i等待已久的机遇。

尽管小i已是行业中少有的极其重视产品应用场景开发的公司,但上游基础技术的瓶颈局限了商业化的空间。AI作为仍处于早期发展的行业,概念与应用之间,还差着无数项技术攻坚。

对垂类市场需求理解深刻的小i机器人,一俟上游基础技术突破,便可以激发出应用端无限想象力,从而带来增长机会。

其实,在创新领域抓住商业机会上,小i机器人的成功经验,已得到商业实践验证与客户的高度认可。

例如,继智能客服实现行业领先地位后,小i又在AI+建筑领域展开探索,推出了全程自动化的智能审图等产品,降低建筑行业成本。2021年小i和中国建筑(601668.SH)签订两项AI+建筑领域的新合同。

AI智能审图产品,来源:小i机器人

商业化落地场景和行业的不断丰富,为小i机器人带来业绩提升。2021年,小i机器人营收实现3252万美元,同比增长134.6%,并于同期实现扭亏为盈,净利润达到337万美元。

随着大语言模型技术的重大进展和生成式AI应用领域拓宽,可以想见,小i机器人也将在更多垂直领域研发出具有商业价值的创新产品。

艰难环境下,市场亟待寻求新方向之时,底层人工智能技术革新,犹如一颗横空出世的新星。

有生之年,躬逢其盛。

技术的进步并不会变成一家独大的垄断竞争。供给侧的结构性变化,会激发需求侧产生更多想象力,从而为全行业带来新的商业机会。

能够敏锐捕捉需求变化、并有能力快速追踪落地的公司,将在划时代的机遇来临时,走在同业的前列。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1