瞻观前沿
电子电信研究所(ETRI)的研究人员推出了一项将生成式人工智能和视觉智能相结合的技术,只需2秒即可根据文本输入创建图像,推动超快速生成式视觉智能领域的发展。ETRI宣布向公众发布五种型号。其中包括三个模型“KOALA”,它从文本输入生成图像的速度比现有方法快五倍,以及两个会话视觉语言模型“Ko-LLaVA”,它可以用图像或视频进行问答。
“KOALA”模型使用知识蒸馏技术,将参数从公共 SW 模型的 2.56B(25.6 亿)显着减少到 700M(7 亿)。大量参数通常意味着更多计算,导致处理时间更长并增加运营成本。研究人员将模型大小减少了三分之一,并将高分辨率图像的生成速度提高到以前的两倍,与DALL-E 3相比快了五倍。ETRI成功地大幅减小了模型的大小(1.7B(Large)、1B(Base)、700M(Small)),并将生成速度提高到2秒左右,使其能够在仅 8GB 内存的低成本 GPU 上运行国内外文本到图像生成的竞争格局。
研究团队预计,生成人工智能市场将从以文本为中心的生成模型逐渐转变为多模态生成模型,在模型大小的竞争格局中,将出现更小、更高效的模型的新趋势。
图片来源:摄图网
技术价值观察
我国的AIGC产业可大致分为基础设施层、模型层及应用层,目前整体层级尚不够完整,模型层成为当前关键卡口。在一定程度上限制了上下层级的发展。
基础设施层:主要分为数据层、算力层、计算平台、模型开发训练平台和其他配套设施。模型层:即垂直化、应用化、场景化的模型和应用工具,主要分为底层通用大模型和中间层模型,底层通用大模型又可分为开源基础模型、非开源基础模型和模型托管平台;
中间层模型有人类互动反馈、大模型调整和个性化模型。
应用层:即面向C端用户的文字、图片、音视频等内容生成服务,按不同的价值创造逻辑,可分为生产可直接消费内容、结合底层系统生产高附加值内容、提供内容生产辅助工具、用于提供体系化解决方案四类。在这四类中,目前我国落地及变现进展最快的是生产可直接消费内容这一赛道。
电子电信研究所(ETRI)研究人员推出了一项将生成式人工智能和视觉智能相结合的技术,“KOALA”模型将图像生成速度提高到2秒左右。因此,从AIGC产业链上看,该技术处于产业链的模型层。
宏观市场观察
——AIGC定义及分类
AIGC全称为AI-Geneated Content,指基于大型预训练模型、生成对抗网络GAN等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术。
狭义的AIGC更关注图像、文本、音频、视频等内容生成,等同于Syntthetic media,Generative Aid等概念。而广义的AIGC则还包括策略生成(如Game AI中游戏策略的生成)、代码生成(如GitHub Copilot)、蛋白质结构生成等。AIGC行业属于战略新兴产业,结合人工智能的分类,根据国家统计局发布的《战略性新兴产业分类(2018)》,AIGC行业所属战略性新兴产业分类与国名经济行业对应如下:
——合成数据为AI模型训练开发提供强大助推器
合成数据是计算机模拟技术或算法创建、生成的自标注信息,可以在数学上或统计学上反映真实世界数据的属性,因此可以作为真实世界数据的替代品,来训练、测试、验证AI模型。目前人工智能仍处于1.0阶段,数据是最大阻碍,但合成数据将有效助推人工智能走向2.0阶段。
——合成数据产业加快成为数据要素市场新赛道,科技大厂和创新企业抢先布局
合成数据对人工智能发展的巨大价值使其加速成为AI领域的一个新产业赛道。一方面,国外的主流科技公司纷纷瞄准合成数据领域;另一方面,合成数据作为AI领域的新型产业,相关创新方兴未艾,合成数据创业公司不断涌现,合成数据的投资并购持续升温,开始涌现了合成数据即服务这一发展前景十分广阔的全新商业模式。
——AI大模型是一种新的智能计算范式
超大规模智能模型,简称大模型,是近年兴起的一种新的人工智能计算范式。和传统AI模型相比,大模型的训练使用了更多的数据,具有更好的泛化性,可以应用到更广泛的下游任务中。按照应用场景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图技术也迅速发展,AI内容生成(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。
——中国AI应用在金融、电信制造、医疗行业加速渗透
目前,随着数字经济与实体经济融合程度不断加深,以及互联网平台的数字化场景向元宇宙转型,人类对数字内容总量和丰富程度的整体需求不断提高。AIGC作为当前新型的内容生产方式,已经率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,市场潜力逐渐显现。与此同时,在推动数实结合、加快产业升级的进程中,金融、医疗、制造、工业等各行各业的AIGC应用也都在快速发展。
据IDC,2022年中国人工智能行业应用渗透度排名前五的行业依次为互联网、金融、政府、电信和制造。另外,AI为自动驾驶、交通物流所赋予的价值也不容忽视,据麦肯锡预计,AI为交通领域创造3800亿元的经济价值。
——主要企业关键技术成果(大模型)及竞争力评价
中国AIGC行业的头部代表性企业中,目前互联网大厂的业务布局最广,主要分布在一线城市和新一线城市,且纷纷在各赛道进行宏观战略布局。但其他初创企业也有自身的优势,在细分赛道也有一番成绩。目前国内已经出现了多家从事大模型开发及延展应用的公司,目前尚未普遍形成对外开放的生态,需要进一步关注相关机构的后续动态。
——企业竞争:竞争激烈,头部互联网企业有优势,但后来者众多
当前,我国的AIGC行业可划分为基础设施层、模型层及应用层三个层级结构。AIGC行业的头部上市公司主要有百度(BIDU.O)、科大讯飞(002230.SZ)、腾讯(00700.HK)等;未上市的AIGC产业领先公司有阿里巴巴、抖音集团、华为、小冰、启元世界、创新奇智、影谱科技、拓尔思、云舶科技、联汇科技、一览科技、视拓云、智源研究院、出门问问、无界AI等。值得一提的是超参数和小冰公司已经明确成为独角兽公司,Minmax据传估值超过十亿美元。
目前,我国的AIGC产业已涌入了互联网大厂,AI公司、生态场景链公司、研究机构等多类参与者。由于产业发展相对有限,目前各类玩家间区别相对有限。在我国的AIGC产业中,应用层是最适合初创企业进入的部分,因此目前应用层的企业竞争也是最为激烈。
目前,中国AIGC行业互联网等大厂具有明显优势,纷纷将资源投入与主营业务结合,打造自己的大模型掌握行业定价权,实现自身生态更好的发展。故挑选了华为、百度、腾讯以及新晋独角兽企业小冰进行市场份额分析。目前,中国AIGC行业的市场集中度较低,产品竞争较为激烈。以人工智能专利数量的申请集中度来看,截止2023年5月为止,申请专利数量排名前四的市场场份额仅占约20%,排名前八的市场前八的仅占约25%,市场集中度较低。导致市场集中度较低的原因主要是因为AI技术迭代更新非常快,即使是头部企业也无法在技术上形成全面优势,另外一方面就是AIGC行业细分赛道较多且仍处于起步阶段,市场空间非常大。
中国人工智能技术赛道热力图
根据前瞻产业热力图显示,与人工智能关键技术强关联的城市集群主要集中在华南和西北地区,并且以广深、西安市为重点发展区域,未来布局人工智能技术及其他相关技术的发展路径,极大可能性在于华南、西北地区优先导入,其中可重点关注广东省广州市天河区、广东省深圳市的福田区及陕西省西安市雁塔区所处的人工智能相关企业,以及该地方对于人工智能产业发展投资环境、供给市场的潜力空间。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《》。
同时前瞻产业研究院还提供、、、、、、、、、咨询等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。
更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。