【保存版】Stable Diffusionで顔・手が崩れる問題の解決方法|ADetailerの使い方

stable-diffusion-face-fix 画像生成AI

せっかく生成した美しい画像が、顔で台無しに

Stable Diffusionで画像生成を始めると、よく遭遇する問題があります。背景は完璧、構図も理想通り、色合いも申し分ないのに、顔を見ると…目の位置がおかしい、鼻が溶けている、指が7本ある。

生成を繰り返すこと50枚、やっと満足できる1枚に出会えるかどうかというケースも珍しくありません。これでは時間もGPUリソースも無駄になってしまいます。

しかし、適切な対策を施すことで、成功率を大幅に引き上げることができます。この記事では、顔や手の崩れを劇的に改善する5つの具体的な方法をお伝えします。

なぜ顔や手が崩れるのか?

技術的な話を簡単に説明すると、Stable Diffusionは「全体のバランス」を優先して画像を生成します。512×512ピクセルの画像を生成する場合、顔に割り当てられるのはわずか64×64ピクセル程度。この解像度では、目や鼻といった細かいパーツを正確に描写するのが困難なのです。

特に手は人体の中でも最も複雑な構造を持つパーツ。関節の数、指の長さの違い、角度による見え方の変化など、学習データの中でもバリエーションが豊富すぎて、AIが「正解」を見つけにくい領域です。

さらに、生成時の解像度が高いほど、ノイズ除去の過程で細部が破綻しやすくなります。768×768以上のサイズで直接生成すると、顔の崩れ率が一気に上がるのはこのためです。

解決方法5つ|実践編

1. ADetailer(After Detailer)の導入【最重要】

ADetailerは、生成後に顔や手の領域を自動検出し、その部分だけを高品質で再生成してくれる拡張機能です。これを導入することで、生成失敗率を劇的に減らすことができます。

導入手順:

  1. AUTOMATIC1111版Stable Diffusion WebUIの「Extensions」タブを開く
  2. 「Available」から「Load from」をクリック
  3. 検索窓に「adetailer」と入力
  4. 「adetailer」を見つけて「Install」
  5. 「Installed」タブで「Apply and restart UI」

再起動後、txt2imgやimg2imgの下部に「ADetailer」という折りたたみメニューが追加されていればOKです。

基本設定(推奨値):

ADetailer model: face_yolov8n.pt
ADetailer prompt: (空欄でOK、またはメインプロンプトと同じ)
Mask blur: 4
Denoising strength: 0.4
Inpaint width/height: 512
CFG Scale: 7

この設定で、顔の検出精度と自然な仕上がりのバランスが取れます。Denoising strengthを0.4にすることで、元の雰囲気を残しつつ細部を修正できる傾向があります。0.5以上にすると別人になりやすいので注意が必要です。

2. Hires.fix(高解像度修正)の併用

ADetailerと組み合わせることで、さらに効果を発揮するのがHires.fixです。これは一度低解像度で生成してから、高解像度にアップスケールする機能。

推奨設定:

Hires. fix: ON
Upscaler: Latent (アニメならR-ESRGAN 4x+ Anime6B)
Hires steps: 15
Denoising strength: 0.5
Upscale by: 2.0

生成フロー: 512×512で基本生成 → Hires.fixで1024×1024に拡大 → ADetailerで顔・手を修正

この3段階アプローチで、大きなサイズでも破綻しない画像が得られます。生成時間は2倍になりますが、試行回数が1/5になるので、結果的に時間短縮につながります。

3. プロンプトの工夫

生成AIは「言葉の解像度」が高いほど正確に描写します。

崩れやすいプロンプト:

beautiful girl, smile

改善版:

beautiful girl, (detailed face:1.2), (perfect eyes:1.1), natural smile,
(5 fingers:1.1), anatomically correct hands

括弧とウェイト値で重要な要素を強調します。特に「detailed face」「perfect eyes」は必須。手を含む構図なら「anatomically correct hands」も追加しましょう。

逆に避けるべきプロンプト:
– 「looking at viewer」を強調しすぎる(目の焦点が合わなくなる)
– 「many fingers」「lots of details」(逆効果になることも)

4. 画像サイズの調整

生成サイズは512×512または512×768が最も安定します。これはStable Diffusion 1.5の学習データの主要解像度だからです。

サイズ別の成功率(私の実測):

サイズ 顔の成功率 備考
512×512 約85% 最も安定、ただし小さい
512×768 約80% 縦構図に最適
768×768 約60% Hires.fix必須
1024×1024 約40% 直接生成は非推奨

大きなサイズが必要なら、必ず512×512で生成してからHires.fixで拡大してください。

5. モデル選び

モデルによって顔の描写能力に大きな差があります。

顔に強いモデル(実際に使っている3つ):

  • Deliberate v2: リアル系、顔の造形が安定
  • Anything V5: アニメ系、目の描写が綺麗
  • ChilloutMix: 実写系、アジア人の顔に強い

逆に、風景特化モデルやアーティスティックなモデルは、人物の顔が苦手な傾向があります。プロジェクトの方向性に合わせて、人物描写に定評のあるモデルを選びましょう。

ADetailer設定の詳細|実践的なTips

基本設定を紹介しましたが、状況に応じて調整することで、さらに精度が上がります。

顔だけでなく手も修正したい場合

ADetailerは複数の検出器を同時に使えます。

ADetailer model 1: face_yolov8n.pt
ADetailer model 2: hand_yolov8n.pt

両方にチェックを入れることで、顔と手を同時に修正できます。ただし生成時間は1.5倍ほどになります。

Denoising strengthの使い分け

  • 0.3-0.4: 元の雰囲気を維持したい場合(推奨)
  • 0.45-0.5: 崩れが激しい場合、多少の変化は許容
  • 0.5以上: 別人になるリスク大(非推奨)

実際に0.35と0.5で比較したところ、0.5では目の色が変わったり、表情が変わったりすることがありました。

Mask blurの調整

  • 4: 標準、境界が自然
  • 6-8: より滑らかな境界、背景と馴染む
  • 2以下: 境界がはっきり、修正範囲が狭い

背景とのつなぎ目が不自然な場合は、Mask blurを6に上げると改善します。

Confidence(検出信頼度)

デフォルトは0.3ですが、顔が小さい構図や横顔の場合は0.2に下げると検出率が上がります。ただし、誤検出も増えるので注意してください。

プロンプト欄の活用

通常は空欄でOKですが、特定の表情や年齢にしたい場合は指定できます。

ADetailer prompt: young woman, bright smile, detailed eyes
Negative prompt: old, wrinkles, tired

メインプロンプトと矛盾しない範囲で指定すると効果的です。

実際の数値改善|検証データ

この方法を導入する前と後で、定量的にどう変わったかを検証したケースがあります。

Before(対策前):
– 生成枚数: 50枚
– 使える画像: 35枚(70%)
– 顔が完璧: 15枚(30%)
– 平均生成時間: 8秒/枚
– 合計時間: 6分40秒

After(ADetailer + Hires.fix導入後):
– 生成枚数: 20枚
– 使える画像: 19枚(95%)
– 顔が完璧: 18枚(90%)
– 平均生成時間: 15秒/枚
– 合計時間: 5分

1枚あたりの時間は増えましたが、ガチャ回数が減ったことで、トータルでは時間短縮になるケースが報告されています。何より、「またダメだった」というストレスから解放されるのが大きなメリットです。

まとめ|顔崩れとの付き合い方

Stable Diffusionで顔が崩れるのは避けられない問題ですが、適切な対策で大幅に改善できます。

今日から実践できること:

  1. ADetailerを必ず導入する(これだけで成功率+20%)
  2. 生成サイズは512×512で固定、大きくしたいときはHires.fix
  3. プロンプトに「detailed face」「perfect eyes」を追加
  4. Denoising strengthは0.4を基準に微調整
  5. 顔に定評のあるモデルを選ぶ

特にADetailerは無料で使えて効果絶大なので、まだ導入していない人は今すぐ試してみてください。設定は私の推奨値をそのまま使えば、ほぼ間違いありません。

最初は設定項目が多くて戸惑うかもしれませんが、一度セットアップすれば後は自動。生成のたびに「顔、大丈夫かな…」と不安になることもなくなります。

あなたの創作活動が、より快適で生産的なものになりますように。

よくある質問

Q1: ADetailerを使っても顔が崩れることはありますか?

A: あります。ADetailerは万能ではなく、成功率を大幅に向上させるツールです。極端なアングルや複雑な構図では、依然として崩れることがあります。

Q2: 顔と手を同時に修正できますか?

A: はい、ADetailerのモデル1に face_yolov8n.pt、モデル2に hand_yolov8n.pt を設定することで同時修正できます。ただし生成時間は約1.5倍になります。

Q3: Hires.fixとADetailerはどちらを先に使いますか?

A: 推奨される順序は「Hires.fix → ADetailer」です。まず解像度を上げてから、顔や手を修正する流れが最も効果的です。

Q4: ADetailerのDenoising strengthはどれくらいが最適ですか?

A: 0.4が標準です。0.3〜0.4なら元の雰囲気を維持しつつ修正でき、0.5以上にすると別人になりやすいため注意してください。


おすすめ書籍

画像生成AIの基礎から応用まで体系的に学びたい方におすすめの一冊です。

『画像生成AI Stable Diffusion スタートガイド』 AICU media(2,640円)

Stable Diffusionの導入から実践的なテクニックまで、初心者でもわかりやすく解説されています。


関連記事:
【2026年最新】画像生成AI徹底比較|Midjourney・GPT-4o・Stable Diffusion・にじジャーニー
Stable Diffusion拡張機能おすすめ10選|品質向上・効率化ツール
Stable Diffusionのモデル(Checkpoint)選び方ガイド|リアル系vsアニメ系
【超初心者向け】Stable Diffusionのインストール方法|PC環境構築から使い方まで



コメント