每经记者:兰素英 每经编辑:高涵
图片来源:主办方供图
随着ChatGPT的问世,人工智能(AI)行业进入了全新的发展阶段。大模型作为一种颠覆性技术,正在吸引越来越多的头部厂商和创业者投入其中。
据花旗最新报告,保守估计生成式AI未来发展规模空间至少达100亿美元,算上对云计算的加成和推动,市场增长潜力将进一步打开。
有数据显示,今年只有1%的内容由AI生成,到2025年,这一数据将达到10%。这场狂欢背后,实际上是AI发展的一次重大飞跃,将带来一场生产力的革命。
为何ChatGPT能成为AI发展的拐点?大模型后续的发展将呈现什么样的趋势?在大模型时代,中小模型将如何?
在5月17日成都举行的“‘科技+资本’双轮驱动的ChatGPT&LLM”闭门大咖会上,稀奇资本合伙人雷强生告诉《每日经济新闻》记者,从目前来看,大模型的赛道已经拥挤不堪,机遇更倾向于头部厂商以及有号召力的互联网大佬,而对于更多的新入局者来说,应该在小模型和子模型层面寻找机会。
每个行业都需要大模型吗?
以ChatGPT为代表的AI技术被视为未来十年最具颠覆性的技术。随着ChatGPT的现象级爆红,科技领域的创业DNA都动了。一时间,打造大模型和类ChatGPT产品成为最热门的话题和趋势。据统计,目前国内已有百度、阿里巴巴、华为等超过40家企业和机构发布了大模型产品或公布了大模型计划。
为什么ChatGPT会触发AI的拐点?
亚马逊云科技资深解决方案架构师贺杨在会议上表示,计算能力增长、数据增长、模型复杂性是AI处于拐点的关键驱动因素。他解释称,“我们可以将ChatGPT理解为AI 2.0,与AI 1.0最本质的区别是用模型驱动任务,将海量的数据压缩存储到模型里面,用非监督的数据进行训练。这样的大模型可以支持很多重要任务,包括文本生成、归纳、提取、问答。”
毫无疑问,从GPT-3所需的参数量来看,训练大模型需要极大的代价。单是计算和资本的投入对大多数企业来说都是难以承受之重。以OpenAI举例来说,训练ChatGPT除了上万张GPU芯片的投入以外,一个月的用电量也相当于17万家庭一年的用电量。此外,模型的性能调优也极其耗时,大概花了半年时间。
在这样的背景下,是不是所有企业或者每个细分领域都需要大模型呢?
昆仑万维CEO方汉认为,“所有行业现在都要干这个事儿,这是不得不干的,行业大模型的价值其实不在于做这个模型,而在于怎么做数据,这是特别苦的事情,但所有人、所有行业都应该重复这个过程。”
昆仑万维CEO方汉 图片来源:主办方供图
多模态发展是共识,但不会带来人类智慧的跃升
目前,AI正在从文本、语音、视觉等单模态智能,向着多种模态融合的通用人工智能方向发展。“基于多模态的预训练大模型将成为人工智能基础设施”,这一观点已成为业内共识。建立统一的、跨场景、多任务的多模态基础模型正在成为人工智能研究的一个关键课题。
总部位于硅谷的向量数据库公司Zilliz的创始人兼CEO星爵解释道,大模型作为一个语言模型,第一次把所有多模态、跨模态统一到一个框架,它精确描述所有意图、所有知识,把所有模态跨模态串联起来。他估计未来两到三年所有的模块都会打通。
阿里巴巴达摩院的一份报告提到,多模态预训练模型的发展将重塑人工智能商业模式,并为人们的生产生活方式带来积极影响。对个人而言,类似CLIP(对比语言-图像预训练)的多模态模型,将使更多非技术出身的人能够表达自己的创造力,无需再借助工具和编程专业能力。
对于这点,成都普朗克科技创始人于芳表示无比赞同。她指出,对于喜欢画画和创造,而同时又属于“手残星人”的使用者来说,“多模态会赋予有创意、有想法的人‘手’和‘眼’,为其带来无限的创作体验,让以前的不可能变为可能,这将是多模态给予这个时代的可能性。”
而对于企业来说,多模态预训练模型将成为企业生产效率提升的关键。商业模式上,具备大数据、算力资源和模型开发能力的科技企业,将会成为模型服务的提供方,帮助企业将基础模型的能力与生产流程融合起来,实现效率和成本最优。
虽然大模型能够实现的很多,但昆仑万维CEO方汉在会上提到一个有趣的观点,即大模型并不会带来人类智慧的提升。他表示,“人类所有的智慧都用文字记录下来了,而现在所有的多模态图像跟视频的人类智慧含量特别少,高质量语料几乎用完了。”不过,从工程角度来说,他认为,图片跟视频这种多模态大模型应用上就特别有价值。
大小模型未来几年将“齐步走”
实际上,在2015年之前,小模型被认为是理解语言的“最先进的技术”。这些小模型擅长分析型任务,被用于从“预测送达时间”到“欺诈信息分类”等各类任务中。
在大模型搅动全球之后,小模型是不是就走到“末路”了?
图片来源:主办方供图
星爵认为,大模型跟中小模型在未来几年会并存。从技术层面来看,他以计算机为例来解释,ChatGPT的通用大模型是超级计算机,而我们每个人携带的笔记本、手机等智能模型,是更小的模型,不需要很强的算力就能获得很好的效果。而从业务层面分析,一定会出现资源配置更加高效的小模型,尤其细分领域的专用模型。
谷歌近日在一年一度的开发者大会上推出最新大模型PaLM 2。这款大模型有四种参数,从小到大分别为“壁虎” (Gecko),“水獭”(Otter)、“野牛”(Bison)、“独角兽”(Unicorn)。AI产品经理、技术博客Orange's AI主理人Leo此前也对《每日经济新闻》记者表示,这种模式非常灵活,最小模型的速度非常快,可以在手机本地运行,而GPT-4则是单一大模型,速度较慢。
站在投资人的角度,稀奇资本合伙人雷强生认为,更多的机会集中在小模型和子模型方面。
他在论坛后接受《每日经济新闻》记者采访时表示,“大模型赛道的主要玩家就是头部厂商以及有号召力的互联网大佬,例如前美团联合创始人王慧文和创新工场董事长兼首席执行官李开复。”
在他看来,生成式AI的定位更多是一个工具,赋能其他行业降本增效,这正是小模型的机会。大模型就像是高速公路这类基础设施,其修建需要资金实力更强的企业,但除了高速公路,社会还需要国道、省道等。
对于小模型领域的发展,他指出,“这主要集中在两个方面:一是针对垂直类行业的小模型,二是重在提升效率等的偏工具类的小模型。”
当被问及如何选择投资标的时,他告诉每经记者,主要分为两类:聚焦场景化应用的老玩家以及初创企业。“老玩家拥有大量高质量的行业数据,加上新的技术方式,就会创造更丰富的应用场景以及更完善的客户体验,市场空间更大。”他同时强调了选择优势产业的重要性,“只有优势的产业才能长出创新的机会。”
每日经济新闻