现在翻开互联网一看,会看到铺天盖地的“GPT-4好厉害”“太牛了”“科技革命到来了”“人类都要失业了”......
然而,如此巨大的变化究竟是如何发生的?因为,从现在来看,我们在很多方面都还是处于摸索阶段。回答似乎有些模糊。仅在ChatGPT上具备基本问答,代写等功能,和微软已着手进行的搜寻、办公是当前较为明确的大语言模式落地方案。若只有这几点,看来,也没有达到科技革命所带来的成效。
这是为什么呢?
答案是任何一种技术都希望最终能产生效应,两者均需经过“技术--产品--经济效益等”三个阶段。从最初的技术到产品再到市场,这是每个企业需要做的第一步。其中产品化就是承上启下的必要环节,许多好技术都是由于不能实现产品化,最后只会止步于专门的或者小众的领域,还有许多变化不需要确定技术指向,就因为产品好,便能触发变化。产品是企业最重要的资产之一,而产品又是由多种要素构成的复杂系统,因此产品的研发和生产需要投入大量资源与精力。正如iPhone整合了许多新技术一样,但是,它本身就是一种产品创新。
在今天的节骨眼里,大家可以感受GPT中所蕴含的变革能量。但是,他是怎样产品化的,却鲜为人知,能够看到的应用方案,主要仍是通过API方式来实现,更是极客与开发者的天下。
那就在这一轮AI热潮中,究竟可能生产出什么样的“杀手级”商品?大语言模型是什么?我们从GPT-4几个关键特性为线索进行研究,来跟你分享一些大语言模型产品的可能性吧。
先不说颠覆世界的那个太虚了,也不要只盯住现有技术能力不放,那样就太实在了。从目前的市场来看,人工智能已经开始了“跑马圈地”式的扩张,但真正能让行业产生颠覆性影响的产品还没有出现。仅在中程阶段产品化,是广大人民群众本轮AI爆发的契机。
信息时代3.0,以“命令”为主线
信息时代颠扑不破两条线:信息获取和个人娱乐。信息获取方式越来越多样化。搜索,信息流,门户网站,直播和短视频,这些互联网产品样态的形成与信息获取效率提升密不可分,和增强个人娱乐体验。GPT-4代表的大语言模型,能在很短的时间内产生海量的内容甚至制作PPT,网站和视频,这些都是传统意义AIGC很难完成的工作。
这种能力演绎下来最重要的产品价值就是大语言模型导致了人类与信息交互方式发生了彻底变革。
英伟达GTC 2023大会上,黄仁勋说:“生成式AI就是一种新型的计算机,我们可以用人类语言进行编程,任何人都可以命令计算机来解决问题。”
“命令”是一个至关重要的术语。在GPT-4和将来更大规模的语言模型作为产品基底时,用户和信息产品、娱乐产品互动方式等,最大的可能是命令。
在信息1.0的今天,您的需求是可查询的,这就意味着搜索机制、所代表的产品是搜索引擎。
在信息2.0的今天,您的需求能够得到迎合,这就需要推荐机制来实现,所代表的商品就是信息流、短视频。
当AI能力进一步提升,您的需要可在短期内定做并得到满足,GPT-4甚至是5、6和7所带来的新机制,是命令机制。
现阶段信息并非已形成,再按照用户的需求去寻找,但信息自身是没有的,在用户下达命令时,重新执行AIGC。这也是信息获取方式的一种变化。比如我是搜索引擎时代的人,想写篇芯片,要靠关键词、关键信息前去查找、查询各类数据报告,要求用户具有耐心及信息查找的能力。现在,人工智能技术发展迅速,很多行业都开始应用人工智能技术。而信息流时代,AI推荐机制将基于本人的搜索、浏览过有关芯片的资料,实现了有关内容的自动推送,其中有些是有用的,有些则是无用的,需使用者加以分辨。
以“命令”作为信息交互方式为主时,我能直接指挥AI查找最近有关芯片的全部信息,并且产生了专属的报告,供本人使用。我只需要在上面输入一个指令就能完成整个工作过程——从测试开始到结束,然后再返回到测试中去,直到结果出来。如有不满也可责令其改正。
如果是这样的命令式的信息采集,生产,学习效率变化,和获取信息的途径。将使人类进入一个新时代——人工智能时代。然后由相似科技推动的AI产生视频,就能大大地改变人们的娱乐模式。这也是为什么今天很多人都在谈“人工智能”的原因之一。如今,我们将感受到许多短视频被模式化和快餐化,简直是AI干出来的,将来这种忧虑可能会消失,由于视频是由AI制作。
影片解说,明星八卦,劲歌热舞,AIGC将在今后的任何时候定制海量视频内容,内部电影信息被GPT捕获,明星八卦是AI搜罗的,舞蹈中男生和女生形象均由AI产生,再也不需要找什么了,再也不需要请AI来建议了,也无需众多短视频创作者的参与、UP主费了九牛二虎之力才做出了剪辑,只要一条指令,轻松数小时娱乐时间被打。
如果说,信息时代1.0是人找信息,2.0是信息找人,然后,由AIGC引发了信息3.0的到来,是任何人都不需要去寻找任何人,AI本身也能产生。
这种产品化机会以继搜索引擎为中心、信息流后创造了“命令引擎”这一新产品形态。“阿拉丁神灯会”是一款很有创意的游戏,它能让我们在不知不觉中感受到一种神奇力量,这就是我们要实现的愿望。我想,“阿拉丁神灯”该是一个不错的名字。
游戏NPC在虎视眈眈
GPT-4发布的那个晚上,我看群里有不少开发者在议论,而且第一条就冒出了有关GPT-4使用的信息,就是有一种说法,能让他成为游戏中的NPC就好。
允许NPC以大语言模型为基座,快来和玩家一起丰富一下吧、多轮次对话,高自由度,应该会让人想起来,但是,这位朋友并没有这么说。
GPT-4的一个关键创新特性,就是使AI对画面进行识别,并了解画面上的细节,内涵等等,例如,能明白一幅搞笑梗图的幽默点究竟是什么。
这一能力若在游戏中使用,就会使游戏及游戏NPC获得一种史无前例的技能——见到玩家。
自电子游戏问世以来,玩家只需要看一下就知道了、听着虚拟的世界而身临其境。在这一过程中,游戏者和真实世界之间存在着一种互动——即物理性交互。玩家在此过程中要尽量远离身边的实际,游戏感总是单向。在这样一种“沉浸式”体验之下,很多人都会忽略身体和心理方面的需求,只注重感官刺激。尽管AR游戏,体感游戏应运而生,在某种程度上,这一状况已经发生了变化,使玩家身姿优美,动作优美、力和玩耍的环境都进入了游戏,但是,比赛本身并不了解选手。
如果让GPT-4成为游戏NPC,还是做为游戏自身的机制,那么也许我们离比赛就可以了解球员了,并且作出相应的反应已为期不远。在这其中,你也许会看到很多人在观察和思考。当您观察到游戏NPC,他们或许还正在观察你,试着去了解自己的神情,体态,诠释着自己比赛时的迷茫,兴奋,或卡关后欲摔手柄之怒。
若将此机制置于某些游戏大师之手,最后作品肯定很震撼。其实AI产生关卡,产生环境,完成了自动渲染和其他技术,已使游戏开发发生了很大的变化,并将GPT-4和游戏进行了深入结合,将来还是一个很大概率的事。
这一整合具有两方面的高概率,一是注重交互的AR,VR游戏,二是强调NPC自由交互的开放世界和多结局角色扮演游戏。
除比赛外,“看懂”的技能也可应用于数字人甚至机器人。这将给人们带来新的思维方式和更多可能。还能带来颇具份量的产品机遇。
“一嘴通办”
讲toC,咱们再聊toB。意思是要实现政府各职能部门间信息共享,并通过网络将所有业务办理过程全部数字化、自动化,使每个政府部门和工作人员能够随时了解到自己需要办理的事项以及相关的服务流程等情况。如今,许多人已经认识了一个字,叫“一网通办”。即打通政务系统各部门信息系统边界,这样就避免了办事人往返于各部门,产生无法完成的程序、盖不住的篇章,跑不掉的道路。
在世界许多地区,一网通办,皆为城市服务,政务和金融、以财税等为中心,以数字化为导向,我国东部沿海地区以及一线城市,“一网通办”亦在高速推进中。
但“一网通办”这一模式实际上还存在痛点:
其一,“通办”只是数据的开通,但是处理的逻辑以及处理的方式还是跟以前没有区别,用户应该没有,或者不应该,是卡是不卡,也许要花很多的时间去重复询问,填答资料,征求意见。
二是“一网通办”效率对操作人员能力依赖性强。在信息化时代,“信息孤岛”现象越来越严重,很多系统都没有实现互联互通,导致大量重复工作产生。受操作人员精力有限,专业能力不足等因素影响,势必对各业务领域一无所知,所以,一但发生复杂,会有操作员尽管可以应付,却不知该怎么解决,需逐层向领导请示或进行部门间的交流,这反倒会使效率下降。
将大语言模型整合到上述方面,不可避免地可以解决其中的某些问题。在人工智能和互联网时代,我们的工作方式正在发生深刻变化。办事人能直接向AI提出建议,认识繁杂的科室、业务间内在逻辑,办事方法等,从而尽可能一次完成办事的需要;企业员工可以借助人工智能进行知识学习和经验积累,通过对自己工作流程中的环节或要素进行分析,获得相关信息并加以利用,进而提升工作效率。而且操作人员还可凭借AI获得跨部门操作方法,操作样例等,这样就可以完成对比较复杂情况高效率的处理了。当然,这一切都需要一个前提——人工智能技术要具备足够的准确性和精确性。关键在于同类能力能更多地使用AI来代替人工。
这类依赖于大语言模型的知识抓取、逻辑分析能力服务平台,“一网通办”可升级为“一嘴通办”,办事人讲清诉求,彻底解决问题。在“互联网+政务”时代,大模型的思维模式已经被广泛接受并应用到各个领域中去,而它本身也将成为未来智慧政府建设的新方向之一。当然,这一称呼纯粹是玩笑,但是以城市服务为中心,必须实现由“网”到“人”的转换,这一点不容置疑,更是大模型时代toB产品发展的核心契机。
同类能力中,落地需求最大的是政务和金融,这两方面所涉事项繁多,专业性较强,并和民众需求息息相关,再往前一点想,大概还涉及财税,法律,医疗等方面。GPT代表的大语言模型,可突破公众服务界限,使AI将专业知识和用户需求联系在一起。
整合了建议,数据汇总,事项处理等功能、文书认证等新AI服务平台,将成为下一步toB市场AI技术发展的中心契机。
超无代码开发
在移动互联网上掀起了创业高潮,经常有人开玩笑说,“我创意、机会、方法论都有了,距离拿到融资就差一个程序员”。
这话固然是笑谈,但是笑谈中的我们也许会发现即使是那位程序员也毫不逊色。
ChatGPT让人惊艳的一点,在于自动生成并修改代码。这不正是传统软件开发中所使用到的人工智能吗?事实上,有不少程序员朋友表示,与AI模型相似,其功能也以辅助工作为主,完全无法取代懂业务的人、懂得产品逻辑和实现方式,程序员。
但是复杂的发展不一定能成功,单纯就不可能了?如果你是个新手,就可以尝试一下这款软件——它提供的功能很丰富,包括建模、布局设计以及动画制作等。GPT-4在推出过程中展示了一个创新,是使模型按要求自动产生站点,尽管产生的结果是粗糙的,但是已达到开发的基本要求。
就云计算和软件业而言,低代码开发甚至无代码开发在过去两年里一直是一个很受欢迎的概念。所谓“零编程”就是把软件开发中所有复杂和重复性工作都交给一个软件开发者来完成。核心逻辑就是使用代码库,对现有的开发样例做了快速的复写,但是GPT-4在逻辑上明显更高级一些,他连用户理解架构的能力都没有,而直接按需产生开发程序。
这一功能,在短期内产生复杂软件应用可能是不可能的,但是对许多不具备编程和开发能力者而言,用AI获得小程序、某电商平台、一款简单APP还算合理。
用一些模板搭配GPT-4,可构成“超没有代码”产品形态。在软件项目研发阶段,通过使用该模板,可以使开发人员和客户之间实现快速、便捷地沟通。用户仅需发出需求和付费,便能得到自己的软件应用,开发全过程人工成本接近0。
给人们带来了这样的AI主导,模板加微调软件开发,也许它还会成为新的风口。这就是人工智能的魅力所在,因为它能让人类变得更加智慧和人性化。其实仔细一想,今天随手可以拉一个群聊聊天,在互联网聊天室初期,这种情况是完全不可想象的,然后以后人手好几个APP,一大堆站点,一批数字人恐怕并不难。
由预训练的大模型兴起,再到今天的ChatGPT、GPT-4,其中以智能涌现效应的推动作用最为引人注目,作为信息化常识,有些内容已经发生了变化。这就像人的大脑在学习过程中,会经历一个“感知—判断—执行”的复杂思维过程一样,每个认知阶段都有其特定的标准和规则,只有这样才能获得最佳学习效果。也就是说GPT-4只是一个条件而非结果。
只有利用这些新条件、获得新方法、打造新产品,才能在AI时代取得最佳效果。
有的人会担心在如此巨大的改变下,是否颠覆了自己的工作和生活?
事实上呢,这焦虑在任何情况下都会存在,只是从未真正成为一场灾难。
朴树在1999年拥有了一首名为《New Day》的歌曲,其中有一首歌词这样写道,“快来吧奔腾电脑,就让它们代替我来思考”。
二十多年后的今天,人类仍然思索着奔腾电脑的去向?