生成式AI在过去一年内风靡全球。人工智能、大模型、AIGC等一系列概念,也不再局限于技术圈的圈内“自嗨”,而是早早破圈,随着ChatGPT的爆火进入大众视野。
近日,横空出世的Sora,更是被让大众相信“AI理解和模拟现实物理世界”的盛况近在眼前。越来越多的人开始意识到,这波技术浪潮极有可能颠覆信息技术的底层架构,将互联网历史带入新的纪元。
纵观Gartner最新发布的《2024年十大战略技术趋势报告》,有且仅有的唯一主题词是人工智能。
面向未来,Gartner预测,到 2026年超过80%的企业将使用生成式AI的API或模型,或在生产环境中部署支持生成式AI的应用,而在2023年初这一比例不到5%。
可以预见的是,生成式AI的应用落地将创新产业生态模式。在过去的2023年,生成式AI的发展堪称迅猛,但关于其数据安全、伦理挑战以及合规性等问题也逐渐暴露出来。
随着越来越多的创新应用场景和产品形态的不断涌现,生成式AI又会给世界带来哪些新的范式变革?围绕生成式AI的创业难点在哪里?生成式AI会诞生真正引爆全民狂欢的“超级应用”吗?
51CTO“T前线”栏目特邀两位重磅嘉宾——NETSTARS首席技术官陈斌、腾讯CSIG技术总监黄闻欣,共同探讨以上话题。
以下为直播实录,经过不改变原意的文本梳理:
T前线:生成式AI技术带来了新的AI发展范式。无论是在解放个体生产力,还是在重塑产业形态上,其应用前景都十分广阔。比如,在获取信息的方式上,相较传统的搜索引擎,生成式AI有哪些想象空间?
陈斌:传统的搜索,往往是根据用户要搜的问题的关键词,提供一堆根本看不完的搜索结果。相较之下,GPT会直接根据你所提问题的精准度,给你更加有目标、更加小范围的答案。
而且搜索是一次性的,你问一次,换方式再问一次,结果都不一样。但GPT可以通过持续互动,逐渐去接近问题的核心。所以GPT给你的是更有框架性的知识,而搜索引擎提供的是一些需要你再进一步分析的信息。
想象的空间在于GPT可以驱动你要完成的任务。传统搜索通常是到给出搜索结果就结束了,而GPT不仅是让你得到某种结果,其后还可以根据它的知识背景,根据你的规则和你的数据,在一定的场景中做出决策,进而直接驱动更多场景进行智能化工作。这种决策能力跟搜索引擎相比有质的差异。
黄闻欣:现在大家习惯用GPT来做检索,但检索其实只是GPT能力中很小的一个部分。我之前接触了一个概念叫“教育目标分类法”,很多做AI落地研究的专业人士都会用这种方式辅助思考。我现在也经常用这种方式来启发自己想prompt。
这个概念把我们能做的事情分为记忆、解析、应用、分析、联系、评估、创造这7个领域,不同领域有其对应的一些提示动词。举个例子,比如我们在搜索中说请你描述这个东西是什么样子的,请辨认此物等等,就更多是聚焦在记忆和解析层面。很多时候大家没有把生成式AI真正融入到自己的工作和生活中,就是因为除了记忆和解析之外,在其他层面大家往往是没有想法的。
之前我们做了一个AI应用,想和内部的缺陷管理平台联动。那要怎么写能够用在缺陷管理中的prompt呢,要怎么做才能尽可能打开想象空间,让AI更好用呢?我就跟同事说,可以试着套用教育目标分类法里面那些提示动词进去。比如,写一个prompt去评估缺陷的质量,写一个prompt去分析整个缺陷管理系统里的数据。不同动词组合又可以出来不同的用法,围绕这些我们可以想出非常多的idea,在这个范围内就可能出现很多未来GPT能够延展出来的应用。
围绕大模型应用的开发门槛真的很低吗?
T前线:随着人机交互可以通过一个简单的prompt实现,AI应用的开发门槛似乎正变得越来越低。最近OpenAI推出GPTs,无需代码,通过自然语言交互就可以创建量身定制的GPTs。但从企业的角度来看,要真正推出AI应用产品又没有那么简单。调用GPT的话,需要算力、需要数据、需要人才,需要可持续的商业模式。老师们对此有什么看法?
黄闻欣:首先目前最好用的肯定还是ChatGPT,但OpenAI的这套东西用起来真的不便宜。当你实际去用GPT4的时候,要是只用一个prompt来输出结果,那么消耗的prompt还算在可控范围内。但是如果你想用树型结构的逻辑链去追求更好的输出结果时,那你浪费的Token可能就是十几倍甚至二十几倍的量了。
此外,数据问题也很重要。我始终坚信,如果你要训练出来一个非常好的AI的话,一定要有一个持续产生高质量数据的流程或者产品,这可能在某种程度上也解释了核心竞争力的问题。但事实上我现在并没有找到一个很好的、标准化的途径。我现在的办法就是尽可能用现有的资源去产出相对高质量的数据,我甚至想让我的团队去做标注。我还是相信没有人工的人工智能是不行的。还是要有人工,这可能决定了你的核心竞争力所在,这确实是很重要的部分。
陈斌:GPT在我看来关键的还不是算力。不管是GPU还是其他维持系统运行的资源可能都会找到替代方案,比如GPU也许很快就会被量子计算所取代。更大的问题在于现在硅谷好多公司,包括OpenAI本身在思考的是:如何管制GPT。
GPT是双面刃,用得好与不好差异很大。就像特别聪明的人走正路和走歧路,结果对人类的影响也会不一样。所以这一点可能是越往后大家越关心的事,反倒不是说GPT给我们带来的便利和好处。因为最后如果不能控制住GPT,任由GPT自己向前发展的话,特别是如果产生意识的情况下,对整个人类是很大的威胁。
T前线:围绕大模型开发AI应用产品时,起步阶段我们可能更关注算力成本、数据质量等等,就像黄老师提到的,当我们无法持续产出高质量的数据时,做出来的应用就缺乏核心竞争力,就很容易被别人秒杀。另外需要关注的还有应用之外的东西,就像陈老师聊到的,你的产品是否合不合规、安不安全,这个很有可能成为你这个应用最终是否能真正用起来甚至火起来的关键。
T前线:纵观国内外科技巨头,不少都横跨了云基础设施与大模型,而且在它们那里模型层与应用层的界限相对模糊。由此来看,那些专注于AI应用层的创业公司或者是独立软件开发商(ISV),竞争力在哪里,将来会不会面临被大模型厂商“吞噬”的风险?
陈斌:不会。通用人工智能之外,还有专用人工智能,即解决特定场景下特定任务的智能。如果说GPT就像刚毕业的大学生,有相当的知识储备,具有一定的工作能力。但是你要真正安排人到岗位上干活,其实还差那么一点,因为他要知道来了这个公司,这个公司的业务流程是什么,数据规范是什么,人事制度是什么,所处行业有哪些专业知识,这都需要进一步了解。
换言之,从一个通用的人工智能转化成真正能做事的,可以服务于特定企业或岗位的专属机器人,中间还需要学习和训练。这也就是我们通常所说的,解决应用落地的最后一公里,这不是GPT大厂能搞定的。以我们金融行业为例,每个金融机构都有自己的平台,每个平台都有自己的数据。某些能力很强的金融机构或许会成为行业里FinBot的主宰者,但是同样也少不了最后一公里的训练。
黄闻欣:就像公有云一样,云厂商同样需要很多ISV来触达行业的最后一公里。再者,有些客户需要私有化部署,那么在这个场景下必然还有生存空间。
稍微延展一下这个话题,为什么我们认为各行业的原生巨头会更有竞争力?就像之前提到的,很重要的一点在于他们有持续产生高质量数据的能力。最开始我们想象做AI产品应该要有数据飞轮,但实际这是一道不易跨越的门槛。对创业公司来说,有没有好的产生优质数据的流程,组织结构和配套建设能不能确保数据产生是持续的,向好的,越来越高质量的,我认为这其实是很重要的评判标准之一。
T前线:打个比方,同样隶属于AI绘图生成领域,Midjourney是小型创业团队的标杆,深受好评。与此同时,设计界老牌大厂Adobe推出的Firefly效果也不错。这种情况下,您觉得这两家哪个会更受市场欢迎?
黄闻欣:设计师大脑里面是有自己的想法的,所谓控制性非常重要。从控制力的部分来说,Adobe明显更能理解行业的诉求。Midjourney不断地更新迭代实质也是在解决控制力的问题。
目前来看,如果真的要用来做设计的话,我认为两者融合去用会更好。对用户来说,Midjourney也有它的特长,它生成的东西在精细程度方面细节是更好的。从设计的角度来看,可能设计师会愿意用Midjourney去生成草图、背景图、元素图,然后用Adobe再去做修正或加工。整体来说,一个公司在行业上沉淀得更多,更了解用户要的是什么,其生命力也就更强。
T前线:具备怎样特质的人,更有可能把爆款的AI应用做出来呢?是技术人还是产品经理还是其他呢?
陈斌:传统研发一般分两个阶段,一是根据需求做整体的系统设计,考虑这个系统要采取什么样的架构;二是基于前者的设计,考虑如何用代码实现这个逻辑。在GPT的技术辅助下,第二阶段的工作有很大一部分可以由GPT帮忙生成,实质上解决了很多写代码的工作负荷。
在这一前提下,我现在更需要的是理解业务逻辑、理解架构、能做系统设计的人。而对于写代码的人,反而要求不会很高,只要有判断力,能判定GPT给定的代码靠谱与否、能不能用就可以了。
其实从过程描述里,你也可以看出什么人能做好 GPT应用。这类人不仅能够很好地理解用户的现实需求,同时又能把这个需求很好地表述成GPT可以生成的应用,近似于产品经理和架构师这两者的结合。
理想的情况是:一个很牛的架构师,很容易理解需求,既能把握行业,又能够跟GPT聊好天,能够把适当的约束加上去,把大问题变成小问题,小问题再拆成很明确的逻辑,让GPT生成代码。由这样一个架构师带着约两到三个研发人员,就可以解决大多数问题。
黄闻欣:任何产品的成功必须了解用户痛点,在AI时代也不例外。观察市面上的很多AI应用,看着酷炫,但实际上用户不敢用、也不好用。所以做AI应用,不仅要了解用户的痛点,还要真实地解决用户的痛点。
目前我们正在做AI应用开发,我常跟我们的产品经理说也许我们要能布道。因为AI对于现在很多人来说还是停留在搜索功能,并没有突破这个界限。实际上,它的能力远远不止于此,通过布道的方式去帮助大家突破认知。
此外还有一点值得反思。那就是AI取代人类也许是某种偏见,那么我们就需要打造出有温度的AI产品来打破这种抵触反抗心理。你不能太囿于程序员思维,要理解到人性,要理解国家的合规要求,要理解人与人之间的关系。你要做的不是冷冰冰的产品,而是要以正确的方式让AI更好地融入我们的工作生活,让大家更好地去接纳AI,我觉得这也是作为一个做AI应用的人需要去考虑的事情。
T前线:过去一年其实出现了不少惊艳一时的AI应用,但都还算不上是大模型时代的超级应用。我们距离这样的超级应用还有多远?如果说ChatGPT让AI迎来iPhone时刻,那么何种力量会让AI超级应用出现“微信”时刻?
黄闻欣:其实在我心目中ChatGPT已经是超级应用了。无论是它的用户量、它的使用场景,包括它现在推出的GPTs,其实都有超级应用的初始形态,即所谓SuperApp的样子。事实上你可以看到其整体增量是很夸张很恐怖的。虽然说现在prompt安全性有点问题,但是也不妨碍大家对它的热情。
而像Midjourney这样的产品,它最多是带给你一时的新奇和刺激。即使你把它看做是娱乐工具,你也不可能一天到晚沉浸其中,过段时间也就疲了。最终你可能还是要用ChatGPT类的工具回归到自己的工作和生活里面。
陈斌:看你怎么定义超级应用。如果像中国的微信或者美国的Facebook,大家每天高频度使用,那GPT其实一出来就有了替代谷歌等搜索引擎的趋向。
我觉得AI时代不会出现像微信或者Facebook、Whats app这种超级应用,而是会融合到很多智能实体或者智能机器人中去,天上飞的、地上跑的、生产线上的、帮你做家务的、帮你写代码的……到后来,你会觉得GPT无所不在。从单纯的互联网产品的角度看,我也同意黄老师的说法,ChatGPT本身就是个超级应用,没有哪个应用比它抓取用户的速度来得更快的了。
黄闻欣:就像陈老师说的,AI在不同领域更多的是起到赋能的作用。事实上,我们现在能做的很多场景,针对用户痛点的场景早已经做了。只是生成式AI发展以后,我们在考虑能不能用AI去重塑重构流程、进而提升效率?严格来说,这其实是用一种新的方式去取代原来的应用的方式。AI让我们能更快速地产生我们自己构思设计的,用于解决自己或他人问题的应用的能力。
比如一个HR,他每天处理报表都很辛苦。之前因为他不会写代码,所以他只能用文本告诉你step1用什么函数,step2用什么函数,step3用什么函数。现在他可以用ChatGPT通过JS或者VBScript,自动生成功能类似的脚本,甚至可以share这个脚本给别人。从这个角度看,这个HR也有了做自己应用的能力。但你说它会不会是爆款呢?它用了GPT,GPT本身是一个高频爆款,但是它解决了更细粒度、更个性化的痛点,并且是个人去解决的。这反而是AI时代更让人兴奋的东西,但它不是一个很商业化的构思。
经过一年多的狂飙突进,迈入2024年,我们依旧对生成式AI抱着极大的期待和好奇心。
或许我们一时很难看到传统意义上的“超级应用”,但是人工智能必将被更广泛地整合到各行业领域和生产环节。这一趋势让AI不仅作为工具,更是作为一种变革的力量重塑我们在数字和创意领域的存在方式。
与此同时,生成式AI在安全性、合规性、版权、伦理方面的复杂性也将进一步暴露无遗,如何寻求平衡的支点在其发展道路上也是长久的议题。
如果觉得本文对你有所启发,或者对于生成式AI的落地应用有自己的见解,欢迎分享在评论区!