AI再次看到了实现商业化价值的曙光。
这次,借助OpenAI团队的AI梦想结晶,现象级产品“ChatGPT”,AI应用火出天际。
但是,就目前而言,ChatGPT和之前的AI产品一样,仍未随之出现可见的商业化模式。
既出人意料而又无意外,这看上去矛盾。但多年的实践证明,作为技术应用大国,中国对原创技术的商业化应用探索,常能领先。如今,这对矛盾又一次在类ChatGPT商业化价值探索领域,闪耀着这抹中国色彩。
来自中国合肥的AI创业公司——未来智能,开发的会议办公耳机iFLYBUDS系列,即为类ChatGPT平台商业化做多年努力的结果呈现,也是为之实现商业价值的生态系统,提供垂直场景数据和训练迭代的智能终端。
多年的原创技术和应用大势都曾经或仍在证明:共建才能产生真正的商业繁荣,而共建法则,即构建生态平台。从ChatGPT聚合的技术应用前景看,ChatGPT具备生态特征。
生态需要何种应用技术?未来智能的会议耳机这种AI终端有哪些功能,和ChatGPT有什么关系?如何实现商业化?
老问题:ChatGPT为何在美问世
从AI技术发展路径看,ChatGPT并非新技术成果。在理论上,ChatGPT没有更多创建——核心技术在2017年就已出现。
这次为很么能大火?“因为面向公众开放。”未来智能CEO马啸对华尔街见闻说,“原先ChatGPT做的是企业级服务,或面向大型开发者,这次对公众开放后掀起狂潮。”
ChatGPT问世后横扫全球,在短期内(2个月)即积累了1亿用户,成为全球迄今为止达成1亿用户最快的技术应用工具。说这是工具,但究竟什么是ChatGPT?
简单说,ChatGPT是用Problem Models(问题模型)加上1750亿个参数/节点,以之为基础提供巨量、有监督的学习数据,借助Transformer架构,“投喂”给AI训练模型,做出的AI应用效果。
这么解释或许过于抽象,那就换种说法。
顾名思义,ChatGPT中的“Chat”是“聊天”的意思,GPT是什么?这是OpenAI公司的一个AI技术名词。民生证券电子行业分析师方竞在研报中写道:ChatGPT是基于OpenAI GPT技术的聊天机器人,拥有3000亿单词的语料基础,预训练出拥有1750亿个参数的模型。
由于GPT的技术核心Transformer神经网络架构在2017年就实现了开源——这个架构由谷歌创建,其革命性在于能让AI“听懂人话”——因此,中国AI领域对此也不陌生。
但是,中国在技术领域一向有着秉持实用主义的“优秀”传统,不愿为看不见或不明确的未来持续投入资本。因此,没有人像OpenAI那样,持续保持大投入,通过Transformer架构做AI技术开发。
“大模型要烧很多钱,因为要大规模做算力分布式节点投入。”马啸说,“所以2017年以来,国内都在观望。”
从现实的角度看,国内不敢投入,也确实因为基于Transformer架构的AI技术开发成本难以承受。
自2017年,Transformer神经网络架构问世,AI即进入大模型阶段。这什么意思?大模型有三要素,即算力、算法和数据。这三要素的相互关系是,算力的强弱,决定算法的效率,而算法又决定数据的有效性;反过来,数据是训练算法的要件,能决定AI学到的知识量。
在业界,能提供高效AI训练的载体是英伟达的A100和H100等AI专用显卡。这种专用显卡与普通消费级显卡的区别在于,后者通常会将部分算力让渡于光追等功能,而前者的特点是从硬件设计到软件配套,都为all in AI服务。
如此很明显,GPT的训练效果优劣,与投入的显卡数量有关——巨额成本即源于此。
这成本多高呢?据说有机构做了测算,训练一个GPT-3,需要至少1024张A100显卡持续运转30天,而A100显卡最便宜的版本,价格也高达8769美元。也就是说,为AI训练做最基础的核心硬件准备,就得投入880万美元。
除了最基础的高额硬件投入,ChatGPT训练所耗费的成本才是不可承受之重。训练一次,需要1000万美元,要训练出一个GPT-3,以每天训练10次,持续30天计算,需要投入30亿美元。
这就是为什么国内对开发基于Transformer架构的GPT技术缺乏探索热情的原因。
因为,成本太高!
样本:“未来智能”会议耳机
现在,美国OpenAI用实力证明GPT技术应用的有效性。
国内闻风而动。
但是,出于同样的原因——实用主义——国内对新技术全部热情的考量源自“这种技术能不能创造出确定的应用商业价值。
现在,ChatGPT刚刚问世,还没出现能大规模落地的商业模式。此时,中国技术公司行动的时刻到了。
就像在顶层话语体系中,相对于传统的西方式现代化,有中国式现代化一样(类似的相对于美国梦的中国梦),国内也会出现中国式ChatGPT,顶层已有此方面的明确指向。
在马啸看来,中国式ChatGPT,可能的演进路径是数家像百度、腾讯或阿里那样的大厂负责平台搭建,之后在此平台上,必然会有“大量基于垂直领域的微调模型,在(中国式)ChatGPT上做垂直领域服务”。
这是互联网和移动互联网技术和商业模式发展的历史路径,也很可能是ChatGPT在中国发展的未来方向。
一旦国内ChatGPT开放API接口,这些做垂直领域小模型技术开发或服务的公司,就能随之接入平台,为之提供垂直细分场景的训练数据和成果,共同为中国式ChatGPT平台的商业繁荣添砖加瓦。
有没有这种公司在做这种探索?
答案:有。
马啸领导的未来智能,已经持续开发了多年AI训练的终端:办公会议耳机。这种品类,立足于细分的办公会议场景,解决办公场景录音、记录、文字转化或语言翻译等多种问题,目的是帮助会议参与人提升办公效率。
办公会议耳机的定位,也就是目标消费群体,包括城市白领、政府官员、律师、记者、外贸从业人员、跨国公司管理和券商分析师等,从中提炼符合职业标准提问的问题模板,以供后续同样场景做调用,这能大幅提升交流效率。
在此过程中,实际上就涉及了垂直领域多种职业的特定语义标签/参数提炼,形成大规模的海量用户数据(库),近似于创建语义大模型。在此基础上,随着耳机目标用户的高频日常使用,相当于在做标准职业问题模板的AI训练。这是未来智能开发的办公会议耳机与ChatGPT的内在关系写照。
举个例子,职业投资人经常跟企业开会,以更全面了解企业情况,以此为投资与否提供参考依据。一般来说,投资人会经常问些共性问题:比如企业年营收多少?有多少盈利?毛利或估值是多少?这种大量的重复性问题,可通过会议耳机的AI技术做标准化特性提取。
当这种垂直职业的数据积累得越多,会议耳机能提取的信息就越精准。通过高效问题模型训练,就会有极大的机会涌现出非常有价值的服务。随后,再通过这种优质服务,带动耳机或其他可能的硬件端的销售,以此形成商业闭环,这就是技术和服务双轮驱动。
目前,未来智能的办公会议耳机已迭代到第四代,共四种类型。2022年,会议耳机出货量同比实现10倍增长。到2024年,未来智能办公会议耳机销量将超过百万台。
更重要的是,这种耳机的AI特性,未来智能的存量或增量耳机都在平时的高频应用中,持续为未来智能的双轮驱动闭环提供动力。
这就是中国式ChatGPT平台商业应用的实际发展和可见的商业价值路径。更重要的是,这一路径经过实践被证明是切实有效的。
核心价值:推动生态共建
要明晰未来智能会议耳机的商业价值,这也是中国式ChatGPT在垂直领域商业化可能的样本。对于这样的样本,像建立在生成类问题模型基础上的ChatGPT技术应用,同类技术原理的会议耳机,AI技术的生成性如何形成?
华尔街见闻了解到,未来智能当前推出的办公会议耳机,自带的软件系统能实现自动学习。这种学习结果,能在又一次的基于语言发音生成的语义文本过程中,按照用户的发音习惯更新自动学习的准确率。由此形成数据训练效果循环迭代。
在用户语音和会议耳机“记录翻译”做“沟通”,也就是AI“听懂人话”时,这种会议耳机的“智能”在一开始,做不到精准理解和文本的准确记录。未来智能设计了一套询问最终文本是不是符合用户理想的系统,以解决这个问题。
如果用户认可,比如打勾,就相当于给耳机做了一次训练;如果打叉,那也是训练,相当于告诉耳机,文本结果不准确。通过这样的方式,实施多轮使用训练迭代后,耳机就会对用户的喜好,越来越理解。当再生成语音转化成文本时,会议耳机对语义的理解就会越来越接近原意。目前,iFLYBUDS系列办公会议耳机的转写准确率已达98%,在业内首屈一指。
未来智能为用户设立的账号,是提升“人机默契”的核心。比如声纹识别功能,在用户使用会议耳机是,耳机会自动根据声纹特质做匹配。一旦发现是某个曾经使用过耳机的人,就自动关联该用户的沟通记录,随之形成一张该用户的社交网络数据。
这张网将为该行为人的职业特征,提炼重复性的标准问题的标签参数,供AI训练模型跑数据。不同职业的共性问题参数,即形成问题模型数据库。
从底层技术原理出发,未来智能的办公会议耳机,就是所有声音,只要经过耳机,都可被记录和处理。比如将线上或线下的会议语音转成文字,这种文字可能是英文,也可能是日文或其他语种。这要看用户需求是什么。
如果用户想将中文会议记录转成日文,或将英文会议语音转成中文,都能通过这种耳机实现。同时,未来智能的办公会议耳机还具备强智能AI自动学习能力。
事实上,华尔街见闻发现,未来智能开发的办公会议耳机,除了聚合多种AI应用能力,实现围绕办公场景的效率提升,更具想象力的商业前景,是其目标用户应用耳机的过程,相当于在构建一套垂直细分市场的子生态。
若对整个过程简做要概括,即在美国推出ChatGPT生成式AI应用聊天机器人前,国内商业组织在做类似的技术应用探索。双方的区别是美方做高成本的AI技术验证,中方做同类AI技术应用的商业化探索。
比如未来智能,这家公司多年致力于围绕办公场景的细分领域研发AI提效工具——办公会议耳机。自2021年以来至今,未来智能的会议耳机销售的存量和增量终端,在高频应用过程中,形成了领域内有商业闭环的子生态。这个子生态已运行了至少两年,而且是在推进商业落地的过程中逐步迭代。
不难预见,一旦中国式ChatGPT问世,开放API后,未来智能的办公场景AI终端系统就可接入。这相当于给ChatGPT提供了办公场景的AI训练、数据和应用数据库和技术应用解决方案。
像诸如安卓和Windows等平台,之所以具有超越想象的商业价值,是因为在这个平台之上,奔跑着海量的细分生态子系统。这些子系统,共同构成了繁荣的整体大生态。在共建具有高度价值超级平台的同时,子系统也在持续为其所在的垂直细分场景,持续提供源源不断的商业动力。
这才是未来智能推出的会议耳机真正的、核心的、极具商业想象空间的价值核心,也是必将出现的中国式ChatGPT为世界AI商业化落地做出的真正贡献。