Stable Diffusion XLの使い方｜高解像度画像生成のコツとベストプラクティス

Q: Q4: メモリ不足エラーが頻発します。どうすればいいですか？

A: `--medvram` や `--xformers` オプションを追加してください。また、解像度を768×768に下げる、バッチサイズを1にする、といった対策も有効です。

Stable Diffusion XLとは何か
1. 従来モデルとの主な違い
2. SDXLが得意とする分野
必要なPCスペック
インストール方法
1. AUTOMATIC1111 WebUIでの導入
2. ComfyUIでの導入
基本的な使い方
高品質画像を生成するコツ
トラブルシューティング
おすすめのSDXL派生モデル
まとめ
よくある質問
さらに深く学ぶには
おすすめ書籍

Stable Diffusion XLとは何か

Stable Diffusion XL（SDXL）は、Stability AIが2023年7月にリリースした画像生成AIモデルです。従来のStable Diffusion 1.5と比較して、より高解像度で詳細な画像を生成できる点が特徴です。

従来モデルとの主な違い

解像度の向上
– SD 1.5: 512×512ピクセルが基本
– SDXL: 1024×1024ピクセルがネイティブ解像度

モデル構造の改善
SDXLは2つのモデルで構成されています。
– Base モデル: 画像の基本構造を生成
– Refiner モデル: 細部のディテールを追加（オプション）

この2段階構成により、より精密で自然な画像が生成されます。

テキスト理解の向上
SDXLは2つのテキストエンコーダ（OpenCLIP ViT-bigGとCLIP ViT-L）を使用しており、プロンプトの意図をより正確に理解できます。複雑な指示や自然言語での記述にも対応しやすくなっています。

SDXLが得意とする分野

人物画像: 顔の表情、肌の質感、髪の毛の描写が大幅に向上
風景写真: 光の表現、遠近感、細かいディテールの再現性が高い
アーティスティックな表現: 絵画調、イラスト調などの多様なスタイルに対応
テキストレンダリング: 画像内の文字表現が従来モデルより改善（ただし完璧ではない）

必要なPCスペック

SDXLは高性能なモデルであるため、従来のSD 1.5よりも要求スペックが高くなっています。

最低スペック

項目	推奨値
GPU	NVIDIA GeForce RTX 3060 (VRAM 12GB) 以上
RAM	16GB以上
ストレージ	SSD 50GB以上の空き容量
OS	Windows 10/11, Linux (Ubuntu 22.04推奨)

快適に使えるスペック

項目	推奨値
GPU	NVIDIA GeForce RTX 4070 Ti (VRAM 12GB) 以上 / RTX 4090 (24GB)
RAM	32GB以上
ストレージ	NVMe SSD 100GB以上

VRAM不足への対応
– --medvramオプション: 8GB VRAMでも動作可能（速度低下あり）
– --lowvramオプション: 4GB VRAMでも動作（大幅に速度低下）
– xFormersの有効化でメモリ効率を改善

Mac環境での動作

M1/M2チップ搭載のMacでも動作しますが、速度はNVIDIA GPUに劣ります。
– M1 Max/Ultra, M2 Max/Ultraなら実用レベル
– 統合メモリ16GB以上推奨

VRAMが足りない・PCスペックに不安がある方へ

SDXLを快適に動作させるには、RTX 4070 Ti以上のGPUが推奨です。BTOパソコンなら用途に合わせてカスタマイズできます。

ドスパラゲーミングPC特集
– RTX 4070搭載モデル: 20万円台〜
– カスタマイズ対応

→ ラインナップを見る

インストール方法

AUTOMATIC1111 WebUIでの導入

最も一般的な方法は、AUTOMATIC1111のStable Diffusion WebUIを使用することです。

1. 前提条件の確認

# Python 3.10.6のインストール確認
python --version

# Gitのインストール確認
git --version

2. WebUIのインストール

# リポジトリのクローン
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

# Windows: webui-user.batを実行
# Linux/Mac: ./webui.sh を実行

3. SDXLモデルのダウンロード
以下のいずれかの方法でモデルを入手します。

Hugging Faceから公式モデルをダウンロード
Civitaiから派生モデルを入手

ダウンロードしたモデル（.safetensorsファイル）をmodels/Stable-diffusion/フォルダに配置します。

4. 起動と確認
WebUIを起動し、ブラウザでhttp://localhost:7860にアクセス。左上のモデル選択欄でSDXLモデルを選択できれば準備完了です。

ComfyUIでの導入

より柔軟なワークフローを構築したい場合はComfyUIもおすすめです。

# ComfyUIのクローン
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

# 依存関係のインストール
pip install -r requirements.txt

# モデルをmodels/checkpoints/に配置
# 起動
python main.py

基本的な使い方

プロンプトの書き方

SDXLは自然言語での記述に強くなっていますが、効果的なプロンプトには一定の型があります。

基本構造

[主題] + [詳細描写] + [スタイル指定] + [品質タグ]

例: 風景写真

A serene mountain lake at sunset,
crystal clear water reflecting orange and pink clouds,
pine trees on the shore, snow-capped peaks in background,
professional photography, high detail, 8k resolution

例: 人物イラスト

Portrait of a young woman with long flowing hair,
wearing elegant dress, soft lighting, gentle smile,
digital art, highly detailed, trending on artstation

Stable Diffusionを快適に動かすには

SDXLを高速に動作させるには、高性能GPUが必須です。

特徴	内容
推奨GPU	RTX 4070 Ti以上（VRAM 12GB以上）
生成速度	高性能GPUなら数秒で高品質画像
コスパ	クラウドより長期的には自前PCが有利

→ クリエイター向けPC（GPU搭載）を見る

重要なパラメータ設定

Sampling Steps（サンプリングステップ数）
– 推奨値: 20-40ステップ
– 多いほど精細だが、30を超えると効果が頭打ち

CFG Scale（Classifier Free Guidance）
– 推奨値: 7-11
– 低い（3-6）: クリエイティブで予測不能
– 高い（12-15）: プロンプトに忠実だが硬い表現に

Sampler（サンプラー）
SDXLで特に性能が良いサンプラー:
– DPM++ 2M Karras: バランスが良く高速
– DPM++ SDE Karras: 高品質だがやや遅い
– Euler a: シンプルで予測しやすい

解像度設定
– ネイティブ: 1024×1024
– 横長: 1216×832, 1344×768
– 縦長: 832×1216, 768×1344

これらの解像度で学習されているため、極端なアスペクト比は避けるのが無難です。

Refinerの使い方

Refinerモデルは生成画像をさらに精緻化します。

AUTOMATIC1111での設定
1. Refinerモデルをmodels/Stable-diffusion/に配置
2. 「Refiner」セクションを有効化
3. Switch at: 0.8（全体の80%をBaseで生成し、残り20%でRefine）

使用するべきケース
– 顔の細部を綺麗にしたい
– テクスチャの質感を向上させたい
– 商業利用など高品質が求められる場合

使わなくても良いケース
– ラフなアイデア出し
– スピード重視の生成
– イラスト調（Refinerはリアル寄りになる傾向）

【PR】

面倒な環境構築なしでStable Diffusionを使うなら

月990円〜でAUTOMATIC1111環境がブラウザだけで使える。GPU不要・スマホ対応・最短3分で画像生成開始。LoRA・ControlNet等の主要拡張も対応済み。

▶ ConoHa AI Canvasを見る

高品質画像を生成するコツ

ネガティブプロンプトの活用

ネガティブプロンプトで不要な要素を排除します。

汎用的なネガティブプロンプト

low quality, bad anatomy, bad hands, text, error,
missing fingers, extra digit, fewer digits, cropped,
worst quality, low quality, normal quality, jpeg artifacts,
signature, watermark, username, blurry

人物生成時の追加ネガティブ

deformed, disfigured, mutation, mutated,
extra limbs, ugly, fat, missing arms

VAEの設定

VAE（Variational Autoencoder）は画像の色合いやコントラストに影響します。

推奨VAE
– sdxl_vae.safetensors（公式）
– sdxl.vae.safetensors（Stabilityai公式）

設定箇所: Settings > Stable Diffusion > SD VAE

VAEを指定すると、色がくすむ問題や彩度が低い問題が改善されます。

Hires.fix（高解像度化）

さらに高解像度にしたい場合は、Hires.fixを使用します。

設定例
– Upscaler: R-ESRGAN 4x+ Anime6B または Latent
– Hires steps: 15-20
– Denoising strength: 0.3-0.5
– Upscale by: 1.5-2.0

これにより、1024×1024から1536×1536や2048×2048に拡大できます。

Seedの活用

気に入った画像が生成されたら、Seed値を記録しておきます。同じSeed値を使うことで、プロンプトを微調整しながら似た構図の画像を生成できます。

トラブルシューティング

Out of Memory（メモリ不足）エラー

対処法1: コマンドラインオプションを追加
webui-user.bat（またはwebui-user.sh）を編集

set COMMANDLINE_ARGS=--medvram --xformers

対処法2: 解像度を下げる
– 768×768や512×512で生成
– 後からUpscaleする

対処法3: バッチサイズを減らす
Batch sizeを1に設定

画像がぼやける・色がくすむ

原因: VAEが正しく読み込まれていない

解決策:
1. Settings > Stable Diffusion > SD VAE で正しいVAEを選択
2. モデルファイル名に.vae.safetensorsを含めておく

プロンプトが反映されない

チェックポイント:
1. CFG Scaleが低すぎないか（7以上推奨）
2. プロンプトに矛盾がないか
3. ネガティブプロンプトが強すぎないか

生成速度が遅い

改善策:
1. xFormersを有効化（VRAM使用量削減＋高速化）
2. サンプラーを変更（DPM++ 2M Karrasは高速）
3. Refinerを使わない
4. ステップ数を25-30に抑える

「メモリ不足」で困っている方へ

設定で回避できない場合、GPU増設やPC買い替えが根本解決になります。Stable Diffusion用に最適化されたPCも販売されています。

→ AI向けPCを探す

まとめ

Stable Diffusion XLは、従来モデルから大幅に進化した画像生成AIです。

重要ポイントの振り返り
– 1024×1024のネイティブ解像度で高品質画像を生成
– VRAM 12GB以上のGPU推奨
– プロンプトは自然言語でも理解するが、構造化すると精度向上
– Refinerで更なる品質向上が可能
– VAE設定で色の問題を解決
– メモリ不足には--medvramや--xformersで対応

技術解説に特化した内容を中心に紹介しましたが、実際に手を動かして試すことで理解が深まります。まずは公式モデルで基本操作を習得し、その後派生モデルやLoRA、ControlNetなどの拡張機能に挑戦すると良いでしょう。

よくある質問

Q1: SDXLとSD 1.5の違いを簡単に教えてください。

A: SDXLは1024×1024のネイティブ解像度で、細部まで精密な画像を生成できます。SD 1.5は512×512が基本で軽量ですが、細部の描写はSDXLに劣ります。

Q2: SDXLは初心者でも使えますか？

A: はい、AUTOMATIC1111 WebUIなら基本的な使い方はSD 1.5と同じです。ただし、PCスペック（VRAM 12GB以上推奨）が要求されます。

Q3: SD 1.5のモデルやLoRAはSDXLで使えますか？

A: いいえ、互換性がありません。SDXLには専用のモデルとLoRAが必要です。Civitaiで「SDXL」タグで検索してください。

Q4: メモリ不足エラーが頻発します。どうすればいいですか？

A: --medvram や --xformers オプションを追加してください。また、解像度を768×768に下げる、バッチサイズを1にする、といった対策も有効です。

さらに深く学ぶには

【PR】

📚 書籍で体系的に学ぶ

「Stable Diffusion AI画像生成ガイドブック」
– SDXL対応の最新版
– プロンプトテクニック集付き
– Amazon ★4.3（300件以上）

「画像生成AIで絵を描く」
– 初心者向けの丁寧な解説
– 商用利用の注意点も解説

💻 スペック不足を解決

SDXLを快適に使うなら、RTX 4070 Ti以上が推奨です。

ドスパラクリエイター向けPC
– RTX 4080搭載: 30万円台〜
– メモリ32GB以上のモデルも

→ ラインナップを見る

🎓 プロから学ぶ

独学に限界を感じたら、オンライン講座も選択肢です。

Udemy「Stable Diffusion完全マスター」
– セール時は2,000円台で受講可能
– 動画で分かりやすい

→ コースを見る