大模型时代,科幻照进现实。乐观者认为大模型的发展将帮助人类构建科技理想国;悲观者认为人类会被科技所操控。在通往AGI的路上,我们将经历一番怎样的探索与拉扯?
4月26日晚间,昆仑万维CEO方汉做客CSDN“开谈”直播间,畅聊他眼中大模型的未来,以及行业发展背后更深层次的思考。
↓以下为访谈节目的精华部分 ↓
聊「天工」
大模型的本质类似操作系统或CPU
主持人:当ChatGPT出来之后,对您公司业务产生了哪些变化?大模型出来之后,对应用市场会产生怎样的影响?
方汉:昆仑万维是一家偏内容和社交的公司,旗下有Opera浏览器,音乐社交产品StarMaker,以及ArkGames游戏产品。这三块业务受到了非常大的影响。
Opera浏览器是目前全球第三大浏览器,有3.24亿的月活用户。浏览器本来只是搜索引擎的入口,自从预训练大模型出来之后,就成为预训练大模型的一个重要的入口。现在已经接入了预训练大模型,能够让普通用户通过浏览器直接使用预训练大模型,实现个人助手的功能。
对游戏研发来说,策划使用大模型来做文案撰写,做数值设计;程序员用大模型来帮助自己撰写代码;美术用大模型来绘制原画。所有人的生产率至少翻了一倍。这对于一个研发公司来说是非常了不起的进步,对于内容生产领域是很大的一个冲击。
我们的音乐社交产品StarMaker,它是在线唱歌和歌曲创作的全球性音乐社区。在AIGC的加持下,没有受过任何专业训练的普通人也可以作词、作曲、编曲,并且能够转成完整的演唱体验。
我们全公司每个生产部门的同事都受益于大模型带来的变化,生产效率变高,用户使用门槛降低,正面意义是非常大的。
主持人:昆仑万维前不久发布了大语言模型「天工」,是不是相当于贵公司的下一个业务方向?还是说是「天工」大模型只为自己企业赋能?
方汉:我们发布的「天工」是拥有千亿参数的预训练大模型,它对标的是 ChatGPT-3.5这样的底座模型,「天工」的应用范围也是面向全社会的。
主持人:如果把「天工」当成应用,它会是新的应用方向吗?
方总:我觉得不能把大模型当成应用。 现在我们只用了它第一层——个人助手。大模型本质上是类似于操作系统或者是CPU级别的东西。大模型最大的功能是利用它自身涌现出来的逻辑推理能力去控制其他的专用模型或者其他的API,来增强它的能力范围。底座大模型可能更类似于安卓的和GMS的关系。安卓是底座的操作系统,上层做大量应用来形成Google Framework提供一些基础的功能。同时还有千百万的APP基于操作系统来提供服务。
聊“吞噬”
新范式推动内容创作繁荣发展
主持人:我们有注意到, ChatGPT自己也在快速演进,比如引入了插件模式弥补不足。也有人担心 ChatGPT会吞噬应用市场。您如何看待这种担心?
方汉: 我觉得“ 吞噬”这个词过重了。大模型的出现的确会带来整个应用市场的重构。在此过程中,部分应用被替代也比较正常。我们的判断标准有两个:
第一,APP 是否在线上完成完全闭环。越是在线上完成闭环的产品或者应用,越容易被取代。一旦跟线下发生关系,那就很难被取代。
第二,是APP的容错率。容错率越低的应用或程序越难被替代。比如说科学计算、军事工程、航空航天,这种对容错率要求极低的行业绝对不可能被替代。在偏娱乐性的创作领域,比如小说、绘画、视频,大家对它的容忍度非常高,这类应用就有可能被替代。
新的范式会带来大量新型的基于这种新范式的应用的出现。总体来说整个应用领域应该是更加多元,更加繁荣,同时部分陈旧的应用会被重构。
主持人:新的发展出来之后,可能会诞生全新的应用场景。畅想一下未来有可能会出现哪些原来没有过的应用?
方汉:大模 型最大改变可能就是降低了人类创作内容的门槛,从而产生更多基于新的内容创作范式的工具和社区。 大模型介入之后,未来可能会诞生更多的艺术家、音乐家。
另外,我觉得大模型最大的影响是知识迁移。GPT-4训练的时候用了92%的英文语料,中文语料占比非常少。由于大语言模型底层的知识迁移作用,现在任何人不用学习英语就可以访问全部的人类知识,这也会带来极大的范式改变。「天工」大模型或者其他大模型,能够让所有的普通人访问全量的人类知识,带来大量的新的应用产生。
聊“未来”
拥抱变化跟上潮流
会使用计算器,也要会造计算器
主持人:在已有的产品里面,如何更好的融入大模型的能力,方总有什么经验和建议?
方汉:首先还是确认产品中有哪些是需要在电脑上闭环完成的。明确自己使用的生产力工具是什么样子。之前提到过如程序员、美术人员,都可以通过大模型提高自己的工作效率。
第二,作为个人助手或者秘书,大模型也能帮助我们提升工作效率。实际上就起到了一个降本增效的作用。对于现在的所有工作流,都可以按照这个逻辑去梳理。
主持人:对于产品经理,如何在产品里中融入大模型的能力?
方汉:首先要看用户群,是否有用户因为使用门槛而被挡在了产品之外。通过增加大模型的输入方式,能否把用户群成倍数放大。
举个例子,作曲或者绘画类APP,用户需要很多前序的知识才能去使用。有了大模型之后,我们可以想象人人皆是创作者,这对于整个用户群的扩大是极有帮助的。另外,有些APP操作较繁琐,或者不够智能。预训练大模型介入之后,能够化繁为简方便用户使用,效率自然也得到提升。
另一种思路,我认为可以看把预训练大模型想象成胶水。它可以把很多种不同的操作通过预训练大模型这个胶水给连接起来。就像AutoGPT,让程序自动去完成复杂、琐碎的工作。
目前大模型主要还是针对文本做预训练,文本是时间序列的产品,相对好做。如果针对图像和视频来进行操作,则加了空间维度。这是下一代大模型,也就是多模态大模型的训练方法。这里有很多技术路径可以走。
GPT-4的路径是把图像强行映射成一些序列,与文本进行对应。这其实是种非常暴力的方法。当然也有新的路径,比如Meta的Segment Anything,它将图像按照语义去切割成块,再去和文本对应。未来所有大模型的工作重点应该都是多模态大模型。多模态大模型成熟之后,预训练大模型和人类现实世界的连接将会真正实现。
主持人:作为开发者,该如何学习?学什么?请方总指点迷津。
方汉:我九四年开始接触互联网,目睹了互联网在中国的蓬勃发展。目前AI的发展,对于所有人来说都是很公平的一个机会。
大模型的出现,将社会金字塔变成两头大的结构。顶部的人成为创意以及方向的把握者,也就是所谓的AI架构师。底部的人是AI操作员。AI的架构师,来定项目方向,定美术的风格,定小说的创意,这是所谓的架构师。操作员听从AI架构的指令,通过Prompt或者其他工具与大模型交互,生成最终内容。
作为架构师,要提高自己的创意能力以及经验,持续不断地学习。不要指望AI替你做所有的事情,一定是自己先懂了,并且能做得更好,才可以来做这个架构师。
在美国有一个有趣的现象, 中小学生考试是可以带计算器的,普通人心算能力比较差。但同时,美国也拥有非常多世界一流的数学家,这是一个典型的两极分化例子。大模型带来的趋势也是如此。
对自己严格要求且具有能力的人,一定要拥抱大模型带来的变化,把主要的学习方向转向机器学习,转向大模型的训练,转向各种各样的新技术。只有精通之后,不管产品如何变化,技术怎么演进,总能立于不败之地。
作为普通人,我们需要的是拥抱变化。把Prompt用好,利用大模型或各种AIGC工具来提高自己的生产力。
对于大多数人来说,学会使用计算器就可以了。对于有能力的人来说,一定要懂得怎么制造计算器。
主持人:除了大模型,全球也涌现出很多创新的应用,在国内整个创业市场并没有构建出丰富的应用生态,您如何看待这种现象?
方汉:我对整体的创业形态还是比较乐观的,只是现在还没有到出成果的阶段。国内重点关注大模型,因为目前为止还没有哪家企业的大模型可以完全赶上OpenAI,当然全世界的情况都一样。所以中国先得在大模型这个赛道决出胜负,大众的注意力才会集中到基于大模型的创业上来。
有人说现在是AI的iPhone时刻,我也认为这是所有IT从业者目前最重要的时刻。希望大家都要拥抱变化,跟上AIGC或者说AGI的发展潮流。也希望大家关注国产大模型,关注「天工」大模型。
奇点来临,我们正深处其中。
希望今天的分享能够给大家带来启发和思考。
END
●昆仑万维入选《巴伦周刊》2023市值增长榜单TOP10
●大模型的正确用法:利用涌现能力控制专用模型
●官宣|「天工」大模型今日启动邀请测试
●你好,我是「天工」
●大模型的下一步发展,是解决准确性和时效性的问题