当前位置:首页|资讯|AI大模型

舌尖上的AI大模型,食品饮料行业未来已来

作者:衔远科技发布时间:2023-06-25

原标题:舌尖上的AI大模型,食品饮料行业未来已来

近日,FBIF2023食品饮料创新论坛及FBIF食品创新展在深圳国际会展中心圆满召开。本届大会以“再造奇迹”为主题,邀请300位全球演讲嘉宾、900+参展商、7000+行业精英到场交流、分享,共同探讨行业创新与增长模式。作为全球领先的致力于链接消费者与商品的人工智能公司,衔远科技受邀参展、参会,公司创始人 周伯文 教授出席论坛并做《舌尖上的AI大模型,将会改变什么?》主题演讲。

衔远科技对周伯文教授的主题演讲内容在保持原意的前提下,进行了系统编辑和梳理,分享如下:

大家下午好!

非常开心来到FBIF创新论坛和大家交流生成式人工智能相关内容,相信这也是大家近期非常关注的领域,即AGI在食品行业能够做什么?

我个人已经从事了近30年的人工智能基础研究,此前在京东负责人工智能与供应链相结合的研发与应用工作也有近5年时间。创立衔远科技之后,我们在相关方面做了更多的探索,今天就为大家分享一下。

1、这一轮AI浪潮与以往有何不同?

近来有很多人问我:这一轮的人工智能浪潮和以前有什么不一样?

我认为,第一个不同在于它是由生成式AI驱动的。为什么生成式AI会比原来的判决式AI更激动人心?这里我想引用美国著名物理学家理查德·费曼(Richard Phillips Feynman)的一句话——“凡是我不能创造的,我都没有真正理解。”

“理查德·费曼代表的是人类智能的最高水平,如果人类智能是这样认为的话”,我2015年在美国一个学术会议上提出,“那么人工智能也应是同理,即一个不懂创造的人工智能,是不具备真正的理解能力的。”因此,生成式AI是人工智能迈向更高阶段的必由之路。

今年以来,ChatGPT的巨大成功,实际上就是一个基于生成式人工智能改变人类各行各业的典型例子。作为一名科学家,过去的半年里,我和大多数同业一样,每天早上起来先要阅读至少5篇以上的论文,以及时了解这一领的最新进展,因为各行各业每天都在发生着大大小小的变化。

如果你问我,未来会怎样?实际上这个问题本身就可以被看作是一个“生成式人工智能”,因为我们提出了问题,然后等待答案的揭晓。所以我认为,预测未来最好的办法,就是我们一起来创造它!创立衔远科技,就是我和团队用生成式人工智能创造未来的一种“回答”。

回顾历史可以看到,技术的发展往往会让人感觉突然间到了一个拐点。这里有两张图,是在纽约第五大道同一地点、不同时间拍摄而成的。我们可以看到,1900年的第五大道上全是马车,而其中很不起眼地出现了第一辆汽车。而仅仅13年后,1913年的第五大道上已经看到一辆马车了。当技术取得关键突破并带来新的可能性之后,我们唯有选择拥抱它。

关于技术的发展,比尔盖茨曾指出:“人们往往会在两年内高估它的变化,却又在十年内低估它的变化。”这个观点放在人工智能领域尤其明显。我本人在AI领域做研究近30年,每隔10年回头看,基本都是天翻地覆的变化,而这一轮人工智能浪潮又有什么不一样?

这就要说到第二点不同。过去,人工智能每一次都是通过与某领域最强的人类竞争并获胜而成为头条,像是大家熟悉的AlphaGo。如果我们继续往前倒带,更早的几个案例都与我本人有着或多或少的关联,因为它们都出自于IBM,而我在回国前长年担任IBM人工智能全球研究院院长以及IBM Watson的首席科学家。

在2016年AlphaGo击败围棋世界顶级棋手李世石之前,人机对抗的案例还有:

回顾历史可以看到,技术的发展往往会让人感觉突然间到了一个拐点。这里有两张图,是在纽约第五大道同一地点、不同时间拍摄而成的。我们可以看到,1900年的第五大道上全是马车,而其中很不起眼地出现了第一辆汽车。而仅仅13年后,1913年的第五大道上已经看到一辆马车了。当技术取得关键突破并带来新的可能性之后,我们唯有选择拥抱它。

关于技术的发展,比尔盖茨曾指出:“人们往往会在两年内高估它的变化,却又在十年内低估它的变化。”这个观点放在人工智能领域尤其明显。我本人在AI领域做研究近30年,每隔10年回头看,基本都是天翻地覆的变化,而这一轮人工智能浪潮又有什么不一样?

这就要说到第二点不同。过去,人工智能每一次都是通过与某领域最强的人类竞争并获胜而成为头条,像是大家熟悉的AlphaGo。如果我们继续往前倒带,更早的几个案例都与我本人有着或多或少的关联,因为它们都出自于IBM,而我在回国前长年担任IBM人工智能全球研究院院长以及IBM Watson的首席科学家。

但所有这一切,就像我先前所说的:AI在过去每一次登上新闻头条,但都是因为它们在对抗中击败了地球上某领域最强的人类。

但这次不一样!

普通用户在每一次使用ChatGPT并感到不可思议的时候,实际都是人类与AI在进行共创。换句话说,是人类用好的Prompt(优质提示),诱发了AI大模型的强大能力。当AI犯错时有人类进行纠正,让它从人类的指令中学会理解错在何处,从而改正并完善自身的能力。因此,这一轮人工智能所取得的突破和成功,本质上都来自于人类与AI的协同交互,这是与过去完全不一样的地方。

相信大家肯定也更喜欢一个能与你协同合作的AI,而不是一个视你为竞争对手的AI。这就是为什么,我认为下一代AI能够也必将深刻改变各行各业的原因。因为一个懂得且善长与人协作的AI,它所具有的价值空间与发展前景,一定会远远高于只想跟人竞争的AI。

2、人工智能演化的三个阶段

作为清华的一名教授,经常会有学生问我与AGI、AIGC、Transformer、GPT这些概念相关的问题。的确,如此多过去少有普通人关注的名词,突然间成为全球热议的焦点并走进普罗大众的认知,在这里我先简单为大家梳理一下:

· AGI代表通用人工智能,是AI的高阶形式。

· AIGC代表生成式人工智能,它是通往AGI的必由之路。正如理查德·费曼所说——凡是我不能创造的,我都没有真正理解。如今,我们已经看到亦或亲身体验到,生成式AI相比判别式AI更加强大。

· Transformer则是生成式AI的重要里程碑。这一观点,我在2016年IBM纽约总部负责其全球人工智能战略规划时就已经提出了。

· GPT系列模型则是引爆这一轮AI浪潮的“导火索”,其中ChatGPT和GPT-4在技术层面所展现出的突破性进展,以及在应用层面取得的巨大商业成功,都堪称前无古人。

在我看来,可以将人工智能分为三个阶段:

第一个阶段:狭义人工智能

这一阶段,大家使用各种小模型,包括神经网络,通过高度受监督的训练去完成任务,而每个任务模型也只能处理特定的事情。这一阶段的好处是,我们人类可以清晰的知道这个人工智能模型能做什么和不能做什么,它的边界是非常清晰的。

第三个阶段:通用人工智能(第二阶段我们放在后面介绍)

关于AGI,大家可以不用管它的学术定义,重点记忆两点概念:

第一,它具备多种能力,而不是只有一种能力;

第二,它在每一个单点的能力上,都逼近或超过人类。

而要具备多种能力,就意味着它要能独立自主的学习和发展。因此,AGI会更美好、更强大,但同时也注定存在风险、可能失控。今天,人类或许还没有准备好迎接AGI,所幸的是AGI也尚未到来。

那么,我们现在身处何处?

第二个阶段:广义人工智能

“广义人工智能”是我在2016年给出的定义,目前看来,可以将2023年作为分水岭,在此之前的狭义人工智能阶段已经过去,而我们正在经历和见证的就是广义人工智能阶段。

什么是广义人工智能?它是指通过预监督或自监督的方式去完成自我训练的AI。在这个训练过程中,它能够端到端的完成多项任务,这与过去的判别式AI不同,而是变成了一个能与人类共创的“生成式助手”。其中很重要的一点在于,它开始产生“涌现能力”,也就是说它具备了此前从未有过的“零样本学习能力”。

试想,一个任务AI从未遇到过,但当你给到它时,它竟然能做出来!这就叫“涌现能力”。我认为,当人工智能迈入这一阶段,它在能力上就已远远胜过狭义人工智能。与此同时,又不会像AGI那样令人们过度担忧和恐慌。所以在这个阶段,我们要做的就是去思考能用它来做些什么?特别对食品饮料行业而言,积极且善于拥抱人工智能的意义重大。

3、未来已来

根据国外专业机构的市场调研分析:2020年,AI在食品饮料行业的市场价值就已达到30亿美金且呈现持续增长态势。但大家要知道,那时的人工智能还处于我们所说的狭义人工智能阶段,人类需要很多不同的模型分别去做不同的事情,比如食品创新、定制、营销、自动化生产、食品监控、安全检测等等。

同一时期,我在京东带领团队搭建了一个叫 JD AI NeuHub 的人工智能开放平台,就是帮助各行各业在供应链上去做效率优化。我们从零做起,最终做到每天调用量达到100亿次。毫无疑问,它是一个非常有价值的平台,否则不会有这么高的调用量,涉及产品的定义、设计、用户研究、市场洞察、交易、售后、客服等诸多方面。但是,我们也为此在 NeuHub 上部署了数百个模型,因为它要以此支撑其应对不同细分场景的任务需求。

但现在不一样了,可以说是历史上第一次,我们有机会用一个模型去实现过去数百个场景中需要的功能并与人进行协同交互。最近,大家越来越多的看到 Stable Diffusion 这些模型在图片创作能力方面的显著提升,同时中国的一些企业也开始利用与以往不同的方式去提升效率,比如更多借助AIGC去做营销和内容的生成等等。

4、大模型能改变什么?

上面举的几个例子还都是小模型的范畴,而接下来我会着重去讲用一个大模型能改变什么?比如在品饮料行业,如何用一个大模型去完全颠覆整个端到端的效率等等。

首先,我们要了解,为什么大模型在技术上具备如此突出的能力?

我们知道,ChatGPT大模型来自于GPT,GPT来自于Transformer,而Transformer则是引发这一轮AI浪潮的重要里程碑。

Transformer相较此前神经网络最大的不同在于,它具备了一个叫做“多头自注意力”的机制。这一机制让神经网络第一次能够一目十行、长期记忆并理解长距离的依存性以及其中的因果关系,从而产生各种更强大的推理能力。值得一提的是,这里说的“多头自注意力”机制,实际来自于我本人2016年的一篇论文,从这个角度来看,我对促成Transformer的诞生也有着第一手的经历。

我的理解是,就像OpenAI说的:大语言模型具备的核心能力,是基于“多头自注意力”架构来预测下一个词,通过这种方式逼着AI去学习、体会并压缩整个世界知识进入到这个大模型。所以,大模型是目前最好的世界知识压缩器。通过预测下一个词的方式,大模型能够去理解整个世界的知识。

“多头自注意力”机制为什么重要?因为它让大模型出现了我们原来从未见到过的“涌现能力”。在很多任务上,虽然人没有显性的去教过大模型就直接向它提出需求,比如做翻译、写总结、回答问题、寻找信息等等,大模型就可以非常轻松的去理解、执行并返回结果——这就是“零样本”的上下文学习能力,这些能力是原来的模型所不具备的。

那又是什么让大模型这样厉害?简单形容,就是因为它完成了对整个世界知识的压缩,所以它能够去理解人的意图,同时与人进行协同和交互。而从技术角度来看,AI大模型还具备三个核心能力:

1、上下文学习能力

举个具体的例子,比如你让大模型去预测下一个词是什么,给到它两句话分别是:

爱因斯坦是德国人

甘地是印度人

问:玛丽·居里 ... ?

从语法的角度来讲,玛丽·居里后面可以跟很多不同的形容词,这个句式都是正确的;

从语义的角度来讲,也可以跟 brilliant、beautiful ,用聪明、漂亮都可以形容玛丽·居里。

但是,大模型却能够准确预测出,玛丽·居里后面应该跟的词是:波兰人。

这就是我们所说的,大模型的上下文自我学习能力。根据爱因斯坦是德国人、甘地是印度人,大模型推理出,你在谈的事情后面有个隐含的概念,就是国籍。当它推理出这个隐含概念后,也就能够通过数据检索正确回答出玛丽·居里是波兰人这个简单的答案,因为它已经将世界知识压缩进了大模型。

当然在计算的过程中,大模型要完成整个的积分。首先,它要对所有的隐含概念进行计算,确定国籍是所有可能的隐含概念里匹配程度最高的,再根据这个结论得出玛丽·居里是波兰人这个最终的答案。所以,是基于上下文的学习能力,加上对隐含概念的推理能力,再加上零样本的泛化能力,让大模型能够做出这类令人感到不可思议的事情。

明白了这一点,相信大家也就能够理解为什么OpenAI不是按照API接口的调用次数收费,而是按照Token的使用数目来收费了。道理很简单,你用的Token越多,你的上文就越长,而你的上文越长,大模型就越有能力去推理出一些核心的概念,也就越能更精准的回答你的问题,与此同时它的计算成本自然也就越高,所以OpenAI是按照Token数目来收费的。只有明白了大模型运作的原理,才能理解它背后的商业模式。

2、思维链能力

还是用一个例子来解释,比如“小明原本有5个网球,之后他又买了两罐,每罐有3个网球,他现在有几个网球?”如果这时只是简单给到AI大模型答案是11个,那么当你继续问它“小明有23个苹果,如果用20个做果盘,又买了6个,小明现在有几个苹果?”AI大模型很可能无法进行正确推理从而答错。但是,如果你对第一个问题的答案给出更清晰的计算推理过程作为提示,比如“小明开始有5个球,新买的2罐网球每罐是3个一共6个,5+6=11,所以答案是11个”,那么再问后面的苹果问题,AI大模型就可以按照同样的推理过程去生成,从而得出正确的答案。这又是一个原来模型所不具备的能力,即AI大模型的推理能力。这种能力可以完成多跳推理,即“通过从A到B、B到C、C到D的推理,从而完成直接从A到D的推理”,这种能力也是我们在大模型上第一次看到的,它改变了人工智能到底能够做什么。

3、指令微调能力

这个能力让AI大模型能够与人的价值观去对齐。如果它犯了错误,你可以告诉它,让它借助你的反馈去纠正并完善自己的生成结果。如果你让大模型给一个6岁的小孩解释什么是登月工程,这个问题本身对它没有任何困难,它马上就可以找到多种答案。比如,以物理学来解释万有引力(答案A);站在历史角度介绍美苏冷战导致的登月(答案B);用天文学说明月球是地球的卫星(答案C);或是从人的美好愿望出发讲述月球上有嫦娥、有玉兔,所以人类想去月球(答案D)等等。但是,大模型并不知道其中哪一个答案最适合6岁的小孩,所以需要为它引入人类反馈机制做强化学习,通过人工打分,给出答案D最适合6岁的小孩,其次是答案C,再次是答案B,而答案A最不适合,因为6岁的小孩很难理解冷战更不懂物理学。当这一系列人类反馈给到AI大模型后,它就可以举一反三,并迅速学会类似问题该如何回答。这时,你再让它“给6岁小孩写一个关于青蛙的童话”,它就不再会从生物学的范畴去介绍青蛙是什么,而是用“很久很久以前,有一个王子...”这类童话句式来开场。当AI大模型具备了这种学习和微调的能力后,就意味着你在使用它的时候,即使它偶尔犯了错,你也可以通过反馈和指令纠正它,而它很快就能学会,从而更好地完成任务。

5、用AI重塑商品价值

了解过大模型的以上三种核心能力,我们再去回答“食品饮料行业用AI能做什么?”这个问题,就会迸发出与以往完全不同的想象力。所以接下来,我会分享一些衔远科技在做的事,帮助大家更直观的认识这种想象力所带来的创新和价值:

衔远科技的理念

让每一件商品都应需而生

让每一个消费者都得偿所愿

我们的核心逻辑是:通过预测消费者和商品在体验上的依存关系,以及细颗粒度品参的对应关系,重新深刻理解什么样的消费者需要什么样的商品;消费者在什么样的场景和体验下,会被什么样的品参、材质、文化符号、功能打动,从而导致二者之间互动的产生。通过衔远大模型对真实世界各类过程中产生的数据进行压缩表示,重构产品与用户的二元关系。同时,这也是我们第一次通过一个大模型,实现对企业5D全生命周期的赋能,这里说的5D包括:对消费与供给的双侧市场机会进行洞察(Discover);帮助企业分析消费人群与场景,定义并孵化爆品(Define);协助设计创新型产品的外观、材质、包装及开发流程等(Design);再到驱动研发、测试与品参改进(Develop);最终通过生成千人千面的内容,完成对消费者的精准触达与高效转化(Distribute)。而以上这一切,都将在历史上第一次通过一个大模型来完全解决

为了实现这一目标,衔远大模型必须同时具备通用能力与专业性,既要有智商、还要有情商。智商让它具备语言、认知和推理的能力,能够明白消费者的反馈信息并根据指令进行微调;情商让它能够准确把握消费者的动机,理解消费者为什么喜欢、为什么不喜欢、为什么购买又为什么不买,基于“共情”的能力与消费者进行有效互动。

同时,大模型还要具备专业性。比如在座的各位,我相信大家都具备良好的智商与情商,但并不是每一个具备这类通识能力的人,都能做到你们在做的具体事情。这种差异的来源,即是对商品的深刻理解。

下面围绕四个应用场景,分别为大家说明衔远大模型能够做什么:

1、知识管理

这个“知识管理”其实很像一个ChatGPT,但不一样的地方在于:首先,它能够去理解和连接一个企业内部所有的流程和知识管理库。换句话说,你可以问它很专业的问题,比如低温酸奶市场渠道拓展的瓶颈在哪里或者高线城市年轻消费者的需求有什么变化等等,你可以把它看成是一个“全能助手”。同时,你也可以通过这个系统去问企业内部的管理流程,比如我明天要去深圳参加FBIF展会,公司的报销流程是什么样的,关于购买机票有什么规定等等,都可以通过知识管理系统来回答。此外,它也可以对接CRM等企业内部的数字化系统,以对话的形式完成企业内部的知识传递和积累。

很多企业经营者问过我,是不是一定要先完成数字化,才能做智能化?如果企业已经完成了数字化,那当然是件好事。但如果还没有,那么通过ProtuctGPT这样一种模式,也可以用智能化去倒逼数字化。有了统一的入口,企业所有的员工、角色和流程都将在ProtuctGPT平台上进行沉淀,从而解决了过去数字化带来的“数据孤岛”和人工造成的“数据中台”等问题。在这个新的框架下,所有的数字化和流程都将沉淀在对话平台上,由其调用不同的后台数字化工具。

2、市场洞察

针对“市场洞察”,衔远大模型主要发挥两个作用:

第一,它能够离线分析我们看到的所有多模态及文本数据,并将这些信息充实到数据表中,所以得出的结论是综合了背后万千用户、品牌情况,打通消费侧到供给侧的全方位智能分析的结果,并不是简单的数据看板。

第二,在用户对数据表进行解读与思考的整个过程中,都会存在一个由大模型驱动的对话助手与你交流和互动。所以,当最终产生儿童酸奶的创新idea时,比如怎样做辅食、如何促进大脑发育等等,这实际上是人和AI通过共创完成的“生成式新品”。

3、客户交互

首先是基于知识的对话能力,可以更好地满足企业对消费者的洞察、理解和服务需求。同时更重要的一点是,基于衔远科技这类“既懂产品又懂用户”的大模型,能够生成千人千面的个性化营销内容。比如,品牌商购买了一个广告位,想要把一款酸奶饮品推荐给消费者,那么怎样进行展现效果会更佳?这就需要企业对消费者有所了解。在衔远科技看来,如果我们发现一个消费者非常关注商品的产地、品质和供应链安全等问题,那么动态生成的酸奶广告画面就会侧重像瑞士一样的青山绿水;如果对另一个消费者的画像显示其更关心哪款酸奶适合在外出露营或春游的时候饮用,那么动态生成的酸奶广告画面就会偏向对应场景氛围的营造,也就是通过生成“千人千面”的营销内容,以同理心迎合消费者的需求、情感和体验,从而实现更精准的触达和更高效的转化。

4、生产工具

通过实现研发的数智化,推动企业生产力的提升。比如,以AI生成配方推动企业研发效率的快速提升。大模型能够自动分析各种配方,并预测不同配方生成后的市场销售情况。同时,通过使用ProductGPT的多轮对话能力,发挥其所包含的不同Skill和Agent能力,帮助企业及员工提升生产力。

综上,衔远科技所做的一切,都是希望通过AI技术搭建品牌与消费者之间的桥梁。让每一件商品都应需而生,让每一个消费者都得偿所愿。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1