SDXL Turbo & Lightning活用ガイド|爆速画像生成の仕組みと使い方

sdxl-turbo-guide Uncategorized

SDXL Turbo/Lightningとは

SDXL TurboとLightningは、Stable Diffusion XLの生成速度を劇的に向上させた蒸留モデルです。従来のSDXLが30-50ステップ必要だったのに対し、1-4ステップで高品質な画像を生成できます。

技術的背景:蒸留(Distillation)とは

蒸留は、大規模な教師モデル(SDXL)の知識を小型の生徒モデルに転移させる技術です。

従来のDiffusionプロセス

ノイズ → Step1 → Step2 → ... → Step50 → 画像

蒸留後(Turbo/Lightning)

ノイズ → Step1 → Step2 → 画像 (48ステップを省略)

実現手段
Adversarial Diffusion Distillation (ADD): TurboがStability AIが開発した手法
Progressive Distillation: Lightningが採用したByteDanceの手法
Few-Step Generation: 複数ステップをまとめて1ステップで処理

主要モデルの比較

1. SDXL Turbo

Stability AI公式の蒸留モデル。1ステップ生成に特化しています。

仕様
– ステップ数: 1-4(推奨1)
– CFG Scale: 1.0固定(ガイダンススケールなし)
– 解像度: 512×512推奨
– ライセンス: 非商用研究用途のみ(Stability AI Non-Commercial License)

特徴
– 最速(1ステップで約0.5秒 / RTX 4090)
– プロンプト遵守度は通常SDXLより低い
– リアルタイムプレビューに最適

2. SDXL Lightning

ByteDanceが開発した蒸留モデル。2/4/8ステップ版があります。

仕様
– ステップ数: 2/4/8(LoRA版と Full版)
– CFG Scale: 1.0-2.0推奨
– 解像度: 1024×1024
– ライセンス: OpenRAIL++(商用可能)

特徴
– 品質とスピードのバランスが良い
– 4ステップ版が最も人気(品質/速度の最適点)
– LoRA版は既存モデルに適用可能

3. Hyper-SD

さらに最適化された蒸留モデル。1-8ステップに対応します。

仕様
– ステップ数: 1/2/4/8(LoRA)
– CFG Scale: 0-8(通常のSDXLと同様に調整可能)
– ライセンス: Apache 2.0(完全商用可)

特徴
– CFGスケールを調整可能(プロンプト遵守度を制御できる)
– SD1.5/SDXLの両方に対応
– LoRA形式で既存ワークフローに統合しやすい

比較表

モデル 推奨ステップ CFG Scale 品質 速度 商用利用
SDXL Turbo 1 1.0固定 最速
SDXL Lightning 4 1.0-2.0 高速
Hyper-SD 4 調整可 高速
SDXL(通常) 30-50 7-10 最高 低速

導入方法

AUTOMATIC1111 WebUIでの設定

1. SDXL Turboの導入

# モデルのダウンロード
cd stable-diffusion-webui/models/Stable-diffusion/
wget https://huggingface.co/stabilityai/sdxl-turbo/resolve/main/sd_xl_turbo_1.0_fp16.safetensors

生成設定
– Sampling method: DPM++ SDE(Turbo専用)
– Sampling steps: 1
– CFG Scale: 1.0
– Width/Height: 512×512

2. SDXL Lightningの導入(LoRA版)

# LoRAのダウンロード
cd stable-diffusion-webui/models/Lora/
wget https://huggingface.co/ByteDance/SDXL-Lightning/resolve/main/sdxl_lightning_4step_lora.safetensors

生成設定
– ベースモデル: SDXL 1.0
– LoRA: sdxl_lightning_4step_lora (Weight: 1.0)
– Sampling method: DPM++ 2M SDE
– Sampling steps: 4
– CFG Scale: 1.5-2.0

3. Hyper-SDの導入

cd stable-diffusion-webui/models/Lora/
wget https://huggingface.co/ByteDance/Hyper-SD/resolve/main/Hyper-SDXL-4steps-lora.safetensors

生成設定
– LoRA: Hyper-SDXL-4steps-lora
– Sampling steps: 4
– CFG Scale: 5-7(通常SDXLと同様)

ComfyUIでの使用

ComfyUIでは専用のカスタムノードで高度な制御が可能です。

基本ワークフロー

Load Checkpoint (SDXL Lightning Full)
  ↓
CLIP Text Encode (Prompt)
  ↓
KSampler
  - steps: 4
  - cfg: 2.0
  - sampler_name: dpmpp_2m_sde
  ↓
VAE Decode
  ↓
Save Image

詳細なワークフローはComfyUIワークフローライブラリを参照してください。

実践的な使い方

1. リアルタイムプレビュー(Turbo)

プロンプトを調整しながらリアルタイムで結果を確認できます。

設定
– SDXL Turbo 1ステップ
– Auto-generate: 有効
– Queue size: 1(最新プロンプトのみ処理)

用途
– コンポジション確認
– ポーズ調整(ControlNet併用)
– スタイル探索

2. 高速バッチ生成(Lightning 4-step)

大量の画像を短時間で生成します。

設定
– Batch count: 10-20
– Batch size: 4(VRAM 12GB以上推奨)
– Sampling steps: 4

用途
– キャラクターのバリエーション生成
– データセット作成
– プロンプト試行錯誤

3. 品質重視の高速生成(Hyper-SD)

CFG Scaleを活用してプロンプト遵守度を調整します。

Prompt: a professional photo of a modern coffee shop interior,
        wooden furniture, plants, natural lighting, architectural photography

CFG Scale: 7
Steps: 4

4. ControlNetとの併用

Lightningは通常のControlNetと互換性があります。

推奨設定
– ControlNet Weight: 0.8-1.0(Turboは0.5-0.7)
– Control Mode: Balanced
– Preprocessor: 通常SDXLと同様

用途
– ポーズ指定(OpenPose)
– 線画からの着色(Lineart)
– 構図維持(Canny、Depth)

高度なテクニック

1. Hires. fixとの組み合わせ

Lightning 4ステップ → Hires. fix(8ステップ)で高解像度化します。

設定
– First pass: Lightning 4step, 512×512
– Hires. fix: Upscaler R-ESRGAN 4x+, 2倍
– Hires steps: 8
– Denoising strength: 0.3-0.5

2. ADetailer(顔修正)の併用

高速生成後、顔部分のみ追加で修正します。

SDXL Lightning 4step(本体生成)
  ↓
ADetailer(顔検出+8ステップ再生成)

3. カスタムLoRAの適用

キャラクターLoRA、スタイルLoRAも併用可能です。

LoRA適用順
1. Lightning LoRA (Weight: 1.0)
2. スタイルLoRA (Weight: 0.6-0.8)
3. キャラLoRA (Weight: 0.8-1.0)

注意: 合計Weight が高すぎると破綻する場合があります。

トラブルシューティング

生成結果がぼやける

原因: サンプラーが不適切、CFG Scaleが低い

対策
– Turbo: サンプラーを “DPM++ SDE” に変更
– Lightning: CFG 1.5-2.0 に設定
– Hyper-SD: CFG 7以上に設定

プロンプトが反映されない

原因: 1ステップではプロンプト遵守度が低い

対策
– 4ステップ版(Lightning/Hyper-SD)を使用
– プロンプトを簡潔に(キーワード5-10個)
– Negative promptを活用

色が過飽和になる

原因: 蒸留プロセスで彩度が強調される傾向

対策
– Negative prompt: “oversaturated, vivid colors”
– VAE: sdxl_vae.safetensors を使用
– 後処理で彩度を調整(-10〜-20%)

商用利用時の注意点

モデル 商用利用 制約
SDXL Turbo 研究・個人利用のみ
SDXL Lightning OpenRAIL++(生成物の倫理的使用義務)
Hyper-SD Apache 2.0(制限なし)

重要: ベースモデル(SDXL)のライセンスも確認してください。カスタムモデルは独自ライセンスの場合があります。

FAQ

Q1. SDXL TurboとLightning、どちらを選ぶべきですか?

商用利用が必要ならLightningまたはHyper-SDを推奨します。リアルタイムプレビューや実験目的ならTurboが最速です。品質重視なら4ステップのLightningまたはHyper-SDが最適です。

Q2. 通常のSDXLとの品質差はどの程度ですか?

4ステップ版(Lightning/Hyper-SD)は通常SDXL(30ステップ)の85-90%の品質を保ちながら、7-10倍高速です。細かいディテール(髪の毛、テクスチャ)は通常SDXLが上回りますが、実用上は十分な品質です。

Q3. LoRA版とFull版の違いは何ですか?

LoRA版は既存のカスタムモデル(アニメモデル等)に適用できますが、Full版は単体で動作します。互換性を優先するならLoRA版、最高速度を求めるならFull版を選択してください。

Q4. Turboで生成した画像を商用利用できますか?

SDXL Turboのライセンス(Stability AI Non-Commercial)では商用利用不可です。商用プロジェクトではLightning(OpenRAIL++)またはHyper-SD(Apache 2.0)を使用してください。

関連記事

出典

コメント