近日,谷歌推出了其最新的文生图大模型——Imagen 2,此模型被誉为谷歌目前最先进的成果之一。Imagen 2的核心优势在于其能够根据用户的提示词生成高质量、逼真的图像,其输出结果与所提供的描述高度匹配。这种匹配度在视觉艺术领域尤为重要,因为它确保了图像的真实感和细节的准确性。
谷歌的增强模型Imagen 2是基于Google DeepMind的技术开发的。在今年5月的科技巨头I/O大会上,谷歌首次对外展示了这一模型的预览版。相比于第一代Imagen,Google声称Imagen 2在图像质量方面有了显著的提升。这些提升包括新功能的引入,如渲染文本和LOGO的能力,这些能力为Imagen 2在创意和设计领域的应用提供了更多可能性。
Imagen 2通过改变训练数据和方法,能够生成更高分辨率、更美观的图像。它使用了扩散和超分辨率模型的结合,这种技术的应用使得Imagen 2能够生成最终的 1024x1024 分辨率图像,展示出更精细和清晰的视觉效果。
谷歌大脑团队的研究人员发布的这款文本至图像的AI模型,在COCO基准上的表现优于DALL-E 2,这一成就突显了其在图像生成领域的先进性。值得注意的是,与许多类似的模型不同,Imagen只对文本数据进行了预训练,这可能是其在生成逼真图像方面的优势之一。
目前,开发人员和云客户可以通过Google Cloud Vertex AI中的Imagen API来使用Imagen 2。这种易于访问的方式为更广泛的用户群提供了使用这一先进技术的机会。总体而言,Imagen 2的发布不仅是谷歌在AI领域的一个重要里程碑,也预示着文生图技术未来的发展方向。