当前位置:首页|资讯|Stable Diffusion|人工智能

SD稳定AI(Stable Diffusion)稳定扩散采样器简明指南

作者:AI万花筒发布时间:2024-01-24

原标题:SD稳定AI(Stable Diffusion)稳定扩散采样器简明指南

简介

稳定扩散是一种先进的人工智能技术,用于生成高质量的图像。它开始于一个带有噪声的原始图像,然后通过一系列步骤逐渐清晰化。想象一下,这就像是从一块粗糙的大理石开始,经过细致雕刻,最终呈现出精美的雕塑。

采样器概述

采样器是稳定扩散中一个关键组件,它负责从模型中选取图像,并逐步去除噪声,使图像清晰。这就像是一步步雕刻和打磨大理石。其中,“采样器”决定了我们如何操作,而“噪声调度器”则决定我们去除多少噪声。

以下测试图像是使用以下参数生成的:

  • Checkpoint: .dreamshaper_631BakedVae.safetensors
  • Positive prompt: .ultra realistic 8k cg, picture-perfect black sports car, desert wasteland road, car drifting, tires churns up the dry earth beneath creating a magnificent sand dust cloud that billows outwards, nuclear mushroom cloud in the background far away, sunset, masterpiece, professional artwork, ultra high resolution, cinematic lighting, cinematic bloom, natural light
  • Negative prompt: .paintings, cartoon, anime, sketches, lowres, sun
  • Width/Height: /.512512
  • CFG Scale: .7
  • Seed: .1954306091

不同采样器的类型和用途

  1. DDPM (去噪扩散概率模型):
  • 详细用途: 在需要重现细致纹理和复杂光影效果的图像中表现良好,如自然风光摄影。
  • 特点: 生成高保真图像,但过程较慢,可能需要数百步才能获得理想结果,适用于不追求快速反馈的专业图像处理。
  • 说明:是 Stable Diffusion 中最早可用的采样器之一,在 Automatic1111 中不再可用。
  1. DDIM (去噪扩散隐式模型):
  • 详细用途: 优秀的选择用于快速生成较为简化的艺术作品,如现代艺术风格的人像。

  • 特点: 在较短的时间内提供良好的质量,例如在50步内就能得到清晰和具有表现力的图像。
  1. PLMS (伪线性多步骤):
  • 详细用途: 适用于动态场景和活动物体的渲染,如运动场景中的动物或车辆。

  • 特点: 相较DDIM,在更短的步骤(如30步)内能够产生更清晰和动态的图像。
  1. 欧拉 (Euler) 和 亨恩 (Heun):
  • 欧拉 (Euler)
  • 详细用途: 欧拉适用于简单的图形和图标设计;
  • 特点: 欧拉步骤少且快速,适合快速迭代;
  • 亨恩 (Heun):
  • 详细用途:亨恩适合于需要一定细节水平的图像,如产品设计图。

  • 特点:亨恩则在增加少量步骤的情况下(如40步)提供更加精细的细节。
  1. LMS (线性多步骤):
  • 详细用途: 非常适合于高分辨率和高复杂度的图像生成,如详细的建筑视图或复杂的工程设计图。

  • 特点: 对计算资源的需求较高,但能在较高的步骤数(如100步)中产生极端细腻和精确的图像。
  1. DPM家族 (包括DPM2和DPM++):
  • 特点: 在较少的步骤(如50步)中能产生高分辨率和高质量的图像。
  • DPM2
  • 详细用途: DPM2适合创建具有细腻纹理和丰富细节的自然场景,如森林或山脉。

  • DPM++
  • 详细用途:DPM++则优于需要结合多种元素的复杂场景,如繁忙的市中心或复杂的科幻场景。

如何选择采样器

  • 图像质量: 对于那些在细节上有极高要求的项目,如专业级别的产品展示或复杂的艺术作品,DPM++ 2M或其Karras版本能提供最佳的细节和纹理复杂度。
  • 生成速度: 在需要快速迭代和测试不同概念的创意过程中,如广告草图或快速原型设计,DDIM或PLMS能够以较少的步骤提供清晰的视觉效果。
  • 计算资源: 当处理资源受限或需要在短时间内生成多个设计方案时,如标志设计或简单插图,Euler或Heun会是理想的选择,因为它们能在较少的计算资源下快速生成结果。
  • 特定应用: 对于如电影视觉效果或高端游戏资产这样的高端应用,可能需要根据具体需求进行试验和调整。例如,DPM++ SDE Karras由于其能在较少步骤中产生富有创造力和变化的图像,可能非常适合这类应用。

结论

稳定扩散采样器是一个强大且多样化的工具,适合各种图像生成需求。了解不同采样器的特点和用途,可以帮助您更好地利用这项技术,创造出令人惊叹的图像。.

参考文献:Complete guide to samplers in Stable Diffusion - Félix Sanz (felixsanz.dev)


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1