生成式AI在视频/3D/游戏等领域的渗透加速
生成算法模型不断突破创新,下游应用场景不断拓展。基础的生成算法模型不断突破创新,基础能力日新月异,从图像向视频和3D扩展,更广泛地应用于下游应用场景 。生成对抗网络(GAN)是早期最著名的生成模型之一,尽管在图像生成上产生了卓越的效果,但其训练常常受到梯度消失和模式崩 溃等问题的影响。与GAN相比,扩散模型(Diffusion Model)只需要训练“生成器”,不需要训练别的网络(判别器、后验分布 等),训练时仅需模仿一个简单的前向过程对应的逆过程,实现简练过程的简化。扩散模型相对GAN来说具有更灵活的模型架构和 更精确的对数似然计算,生成图像质量明显优于GAN,已经成为目前最先进的图像生成模型。
Runway:生成式AI内容平台,Gen-1可实现用文字和图像从现有视频中生成新视频
Runway是一家生成式AI内容平台,致力于让所有人都能进行内容创作。Runway创 立于2018年,总部位于纽约,提供图片、视频领域的生成式AI服务。Runway得到众 多资本青睐,获得谷歌领投的D轮融资。创立以来,Runway已获得Felicis、Coatue、 Amplify、Lux、Compound等顶级投资机构投资。23年6月,Runway获得由谷歌领 投的1亿美元的D轮融资,这笔融资交易包括三年内7500万美元的谷歌云积分和其他服 务,估值达到15亿美元。
《生成式AI下一颗最闪亮的星:视频+引擎》报告来源:幻影视界。
1)内容创作工具的重要性如何?
我们认为关键在于拉动远比工具本身更大的市场,类似于短视频时代的前身 GIF创作工具,如剪映这种创作工具和抖音这种内容生态,Maya这种创作工具和动画的内容生态,视频与建 模工具将进一步大幅拉动生成式AI的需求。
2)能力或出现明显分化。
我们认为当前Diffusion开源模型下各公司生成图片的能力尚未明显出现分化,但建 模和视频更重要的在于和传统工具与工作流的结合 。
3)接下来半年关注什么?
我们认为从能力来看,图片生成的可控性快速提高或将出现,矢量图、结构、视频、 3D模型生成也将提速。尤其关注Unity与Apple的合作,在AI生成内容/建模/App适配上将会如何塑造空间计算 的内容与应用的标准生态。