Stable Diffusionのモデル(Checkpoint)選び方ガイド|リアル系vsアニメ系
Stable Diffusionを使い始めると、モデル(Checkpoint)の選び方で悩む方が多いでしょう。Civitaiを開けば何千ものモデルが並んでおり、「結局どれを使えばいいの?」と迷うのは当然です。
実は、モデル選びで生成画像の8割が決まると言われています。プロンプトも大事ですが、まずは目的に合ったモデルを選ばないと、どれだけプロンプトを工夫しても思い通りの画像は生成できません。
この記事では、人気モデルの特徴を詳しく解説します。2026年現在の最新モデル(SD3.5系、FLUX.1)についても追記しています。
Stable Diffusionのモデルとは
モデル(Checkpoint)は、画像生成の「ベース」となるデータです。同じプロンプトでも、モデルを変えると全く違う画像が生成されます。
主な違いは以下の3点です。
- 画風:リアル、アニメ、イラスト、3D風など
- 得意分野:人物、風景、建築、キャラクターなど
- バージョン:SD 1.5系、SDXL系、SD3.5系で解像度や性能が異なる
初心者がよくやる失敗は、「リアルな人物を生成したいのにアニメ系モデルを使っている」というパターンです。Anything V3でリアルな風景を生成しようとすると、どうしてもアニメ調になってしまいます。
モデル世代の整理:どれを選ぶべきか
2026年現在、Stable Diffusionには大きく3つの世代があります。
SD 1.5系の特徴
- 利点:軽量で動作が速い、モデル数が豊富、LoRAなど拡張が充実
- 欠点:生成解像度が512×512基準、細部の描写がやや甘い
- 推奨環境:VRAM 6GB以上
VRAM 8GBのGTX 1070でも快適に動作します。生成速度は1枚15秒程度(Steps 20の場合)。
SDXL系の特徴
- 利点:高解像度(1024×1024)、細部まで精密、プロンプト理解度が高い
- 欠点:重い(VRAM 10GB以上推奨)、モデル数はまだ少なめ
- 推奨環境:VRAM 12GB以上(RTX 3060以上)
SDXL 1.0 Baseで生成すると、テクスチャの質感や手の描写など、明らかに1.5系より精密です。ただし、同じ設定でも生成時間は約2倍(30秒程度)かかります。
SD 3.5系の特徴(最新)
- 利点:SD3.5 Large(8.1Bパラメーター)、テキスト描画精度が大幅向上、複雑なプロンプトでも破綻しにくい
- 欠点:重い(VRAM 16GB以上推奨)、コミュニティが1.5/XLより少ない
- ライセンス:年商100万ドル以下の事業者は商用無料(Stability AI Community License)
- 推奨環境:RTX 3090以上
2024年10月にリリースされたSD3.5は、Large・Large Turbo・Mediumの3種類があります。Large Turboは高速版で、商業制作への活用が広がっています。
選び方の基準:
– 大量生成・試行錯誤 → SD 1.5
– 高画質・プロ品質 → SDXL または SD3.5
– 最新技術を試したい → SD3.5 / FLUX.1
一般的には、普段の作業はSD 1.5で行い、納品用や重要な画像だけSDXL/SD3.5を使う運用が効率的です。
リアル系モデルの比較
リアル系は実写に近い質感を目指すモデルです。人物、風景、商品写真などに向いています。
1. Realistic Vision V5.1(SD 1.5)
おすすめ度:★★★★★
- 特徴:最も実写に近い、肌の質感が自然、光の表現が秀逸
- 得意:人物ポートレート、風景、建築
- 苦手:極端なアングル、複雑な構図
プロンプトをシンプルに書いても破綻が少ないのが特徴です。例えば「a woman in a coffee shop」だけで、自然な照明と構図の画像が生成されます。
ただし、顔のバリエーションがやや少なく、同じような顔立ちになりがち。年齢や人種を指定するプロンプトを加えると改善されます。
2. DreamShaper 8(SD 1.5)
おすすめ度:★★★★☆
- 特徴:リアルとアート調の中間、色彩が鮮やか
- 得意:ファンタジー、コンセプトアート、風景
- 苦手:完全なリアル写真風
Realistic Visionより少しイラスト寄りですが、その分、幻想的な雰囲気を出しやすいです。ゲームのキービジュアルやTRPGの挿絵に使えます。
同じプロンプト「fantasy castle at sunset」で比較すると、Realistic Visionは写真的、DreamShaperは絵画的な仕上がりになります。
3. SDXL Base 1.0 + Refiner
おすすめ度:★★★★☆
- 特徴:公式モデル、汎用性が高い、細部が精密
- 得意:高解像度が必要なあらゆる用途
- 苦手:特定のスタイルへの特化
SDXL Base単体でも使えますが、Refinerと組み合わせると細部が格段に向上します。2段階生成(Base 80% → Refiner 20%)がおすすめ。
ただし、ファイルサイズが大きい(Base 6.9GB + Refiner 6.1GB)ため、ストレージに余裕が必要です。
4. Stable Diffusion 3.5 Large(最新・推奨)
おすすめ度:★★★★★
- 特徴:8.1Bパラメーター、テキスト描画精度が従来比で大幅向上、複雑なプロンプト対応
- 得意:高品質な人物・風景・テキスト入り画像、商業クリエイティブ
- 苦手:VRAM 16GB未満の環境では動作が重い
- ライセンス:年商100万ドル以下は商用無料
SD3.5は2024年10月にリリースされ、文字の描画精度や色彩表現が大きく改善されています。「春のセール」などの日本語テキストを画像内に自然に配置できるようになりました。軽量版のSD3.5 Mediumも提供されており、VRAM 8GB程度でも動作します。
アニメ・イラスト系モデルの比較
アニメ系はキャラクター、マンガ、ゲームイラストなどに特化したモデルです。
1. Anything V5(SD 1.5)
おすすめ度:★★★★★
- 特徴:汎用性No.1、綺麗な塗り、安定感がある
- 得意:アニメ調キャラクター全般、背景
- 苦手:リアル寄りの表現
Anythingシリーズは最も使われているアニメ系モデルの一つです。V5は色味が自然で、V3にあった「プラスチックっぽさ」が改善されています。
プロンプトに「anime style」と入れなくても自動的にアニメ調になるため、初心者でも扱いやすいです。
2. Counterfeit V3.0(SD 1.5)
おすすめ度:★★★★☆
- 特徴:線画が繊細、ライトノベル挿絵風
- 得意:美少女キャラ、ファンタジー
- 苦手:男性キャラ、リアル寄り
Anythingより線が細く、より「イラスト感」が強いです。目の描写が特に美しく、キャラデザインを重視する場合におすすめ。
ただし、背景が簡素になりがちなので、背景も作り込みたい場合はAnythingの方が向いています。
3. Waifu Diffusion 1.5(SD 1.5)
おすすめ度:★★★☆☆
- 特徴:Danbooru学習、タグ式プロンプトに強い
- 得意:既存アニメキャラの再現、特定のアートスタイル
- 苦手:オリジナルキャラの創造
Danbooru(アニメ画像データベース)で学習されているため、「1girl, blue hair, red eyes, school uniform」のようなタグ形式のプロンプトが効きやすいです。
ただし、他モデルより構図が固定的で、独自性を出しにくい印象です。Pixiv風のイラストを量産したい場合には向いています。
4. AnimagineXL 3.1(SDXL)
おすすめ度:★★★★☆
- 特徴:SDXL版アニメモデル、高精細、新しい画風
- 得意:高解像度アニメイラスト、細部の描写
- 苦手:SD 1.5系のLoRA流用不可
SDXLのアニメモデルとしては最も完成度が高いです。1024×1024でも顔が崩れず、髪の毛の描写が特に美しい。
ただし、SD 1.5系で使えていたLoRAが使えないため、拡張性では劣ります。
注目の新世代モデル(2026年追加)
FLUX.1(Black Forest Labs)
元Stable Diffusion開発チームが立ち上げたBlack Forest Labs(BFL)が2024年8月にリリースした120億パラメーターのモデルです。
特徴:
– FLUX.1 dev:研究・非商用向け(Apache 2.0系ライセンス)
– FLUX.1 schnell:高速版、最速クラスの生成速度
– FLUX.1 pro:API経由で商用利用可能
プロンプト解釈能力がSD系より高く、「Midjourneyを超えた」との評価もあります。ローカル環境ではAUTOMATIC1111では動作せず、WebUI ForgeやComfyUIでの利用が必要です。商用利用の場合はライセンス条件を必ず確認してください。
特殊用途向けモデル
1. Deliberate V2(SD 1.5)
用途:イラスト・アート全般
リアルとアニメの中間で、両方の良いところを取ったようなモデル。コンセプトアート、キャラクターデザイン、広告素材など幅広く使えます。
「photorealistic」「anime style」などのキーワードで画風を調整できる柔軟性があります。
2. Architecture系モデル
用途:建築パース、インテリア
建築ビジュアライゼーションに特化したモデルも存在します。Modern Architecture Diffusionなどが代表的。
空間の奥行き感や素材のリアリティがRealistic Visionより優れています。建築プレゼン用の画像生成には最適です。
3. Product Design系モデル
用途:商品デザイン、プロダクト
工業製品やガジェットのデザイン案を出すのに特化。Realistic Visionだと人物・風景寄りですが、こちらは物体の構造や素材感に強いです。
目的別おすすめモデル早見表
| 用途 | おすすめモデル | 理由 |
|---|---|---|
| 人物ポートレート | Realistic Vision V5.1 | 肌の質感、表情が自然 |
| 風景・背景 | DreamShaper 8 | 色彩豊か、幻想的 |
| アニメキャラ | Anything V5 | 安定感、汎用性 |
| ライトノベル挿絵 | Counterfeit V3.0 | 繊細な線画 |
| 高画質全般 | SDXL Base 1.0 | 細部まで精密 |
| 商業クリエイティブ | SD3.5 Large / Large Turbo | テキスト描画・品質最高水準 |
| コンセプトアート | Deliberate V2 | 柔軟性が高い |
| 建築パース | Architecture系 | 空間表現に特化 |
| 高精細・多目的 | FLUX.1 | プロンプト解釈力が高い |
【PR】
面倒な環境構築なしでStable Diffusionを使うなら
月990円〜でAUTOMATIC1111環境がブラウザだけで使える。GPU不要・スマホ対応・最短3分で画像生成開始。LoRA・ControlNet等の主要拡張も対応済み。
【独自データ】目的別おすすめモデル設定表
モデルを変えるだけでなく、生成設定(解像度・ステップ数・サンプラー・CFG Scale)もモデルに合わせて最適化することで、仕上がりが大きく変わります。他の記事では紹介されていない、モデル別の最適設定値をまとめました。
| 目的 | おすすめモデル | 推奨解像度 | Steps数 | サンプラー | CFG Scale | VAE | 備考 |
|---|---|---|---|---|---|---|---|
| リアル人物ポートレート | Realistic Vision V5.1 | 512×768 | 25〜30 | DPM++ 2M Karras | 7 | vae-ft-mse-840000 | ADetailer併用推奨 |
| アニメキャラ(高品質) | Anything V5 | 512×768 | 20〜25 | DPM++ 2M Karras | 7〜8 | kl-f8-anime2 | ネガティブプロンプトに lowres, bad anatomy 追加 |
| ライトノベル挿絵 | Counterfeit V3.0 | 512×768 | 20〜28 | Euler a | 6〜7 | kl-f8-anime2 | CFG低めで柔らかい線画に |
| ファンタジー・コンセプトアート | DreamShaper 8 | 512×512 | 25〜30 | DPM++ 2M Karras | 7〜9 | vae-ft-mse-840000 | Steps多めで細部の質が上がる |
| 高解像度全般(VRAM 12GB以上) | SDXL Base 1.0 | 1024×1024 | 30〜40 | DPM++ 2M Karras | 7 | sdxl-vae | Base単体で十分だが Refiner +20steps推奨 |
| 高品質商業用(VRAM 16GB以上) | SD3.5 Large | 1024×1024 | 28〜40 | DPM++ 2M Karras | 4.5 | 内蔵VAE | CFGは低め(4〜5)が最適 |
| 高速生成(時間優先) | SD3.5 Large Turbo | 1024×1024 | 4〜8 | Euler | 1〜2 | 内蔵VAE | Turboは Steps少数・CFG低値が前提 |
| 超高品質・プロユース | FLUX.1 dev | 1024×1024 | 20〜30 | Euler | 3.5〜4.5 | 内蔵 | ComfyUI / Forge専用 |
| 大量生成・速度重視 | Realistic Vision V5.1 | 512×512 | 15〜20 | Euler a | 7 | vae-ft-mse-840000 | Steps少なめで高速化 |
| 建築パース | Architecture系(SD 1.5) | 768×512 | 25〜35 | DPM++ 2M Karras | 8〜10 | vae-ft-mse-840000 | CFG高めで構造を明確に |
設定ポイント解説:
– DPM++ 2M Karras は品質・速度バランスが最も良く、特定の理由がなければこれを使えばOK
– Euler a は少ないStepsでもそこそこの品質が出るため、大量生成・プレビュー用に最適
– CFG Scale はモデルごとに適正値が異なる。SD3.5・FLUXは低め(3〜5)、SD 1.5系は7前後が基本
– VAE はモデルに合ったものを使うと色味と精度が改善する。特にアニメ系はアニメ専用VAEを推奨
モデル選びの失敗談と注意点
よくある失敗1:人気だけで選ぶ
Midjourney風のモデルがバズっていても、自分の用途(キャラクターイラスト)に合わないことがあります。
対策:人気より目的との相性を優先しましょう。
よくある失敗2:VRAM不足でクラッシュ
SDXLモデルを8GBのGPUで動かそうとすると、メモリエラーが発生することがあります。
対策:自分のPC環境に合ったモデルを選びましょう。Civitaiのモデルページには推奨VRAMが書いてあることが多いです。
よくある失敗3:古いバージョンを使い続ける
Anything V3を使い続けていると、V5の方が明らかに質が上であることに気づかない場合があります。
対策:定期的にモデルのアップデートをチェックしましょう。
モデルのダウンロードと管理
Civitaiでの探し方
- フィルタを活用:Checkpoint、SD 1.5 or SDXL、タグ(Realisticなど)で絞り込む
- ソート:「Most Downloaded」より「Highest Rated」の方が質が安定
- サンプル画像を確認:プロンプトも表示されるので参考になる
ファイル管理のコツ
モデルファイルは1つ2〜7GBあるため、すぐにストレージを圧迫します。
おすすめの管理方法:
– models/Stable-diffusion/ に基本モデルを配置
– 使用頻度が低いモデルは外付けHDDに退避
– モデル名を「SD15_realistic_RealisticVision_v51.safetensors」のように規則的に命名
safetensors形式を選ぶのも重要です。ckptより安全で、読み込みも速いです。
【PR】モデルの比較検証をしたいけれど、高性能GPUを持っていない方には「ConoHa AI Canvas」がおすすめです。Stable Diffusionベースの画像生成をブラウザだけで利用でき、モデル切り替えや生成テストが環境構築不要で始められます。
まとめ:自分に合ったモデルを見つける
モデル選びに正解はありません。同じ「リアル系」でも、Realistic VisionとDreamShaperでは雰囲気が全く違います。
おすすめの始め方:
-
まずはこの3つを試す
– Realistic Vision V5.1(リアル)
– Anything V5(アニメ)
– Deliberate V2(中間) -
同じプロンプトで比較する
画風の違いを把握できます -
気に入ったモデルを深掘り
そのモデルに合ったプロンプト技術を磨く
最初の1ヶ月はAnything V5だけで十分でしょう。まずは1つのモデルを使い込んで、「もっとこういう画風がほしい」と思ったときに新しいモデルを探すのが効率的です。
高品質な商業用途を目指す方は、SD3.5 MediumやFLUX.1 schnellも試してみる価値があります。
Stable Diffusionの世界は奥が深いですが、モデル選びさえ間違えなければ、誰でもクオリティの高い画像を生成できます。ぜひ自分の目的に合ったモデルを見つけて、画像生成を楽しんでください。
よくある質問
Q1: モデルはどこでダウンロードできますか?
A: Civitai(https://civitai.com/)が最大のモデル配布サイトです。無料で数万種類のモデルがダウンロードできます。ダウンロードしたファイルは models/Stable-diffusion/ フォルダに配置してください。
Q2: モデルファイルのサイズはどれくらいですか?
A: SD 1.5系は約2〜4GB、SDXL系は約6〜13GB、SD3.5 Largeは約16GBです。複数モデルを入れるとストレージを圧迫するため、外付けHDDの使用も検討してください。
Q3: 複数のモデルを同時に使えますか?
A: WebUI上では1つずつ切り替えて使います。ComfyUIなど高度なツールでは複数モデルを組み合わせることも可能です。
Q4: モデルの更新はありますか?
A: 人気モデルは定期的にバージョンアップされます。Civitaiでフォローしておくと、新バージョンリリース時に通知が来ます。
Q5: SD3.5とFLUX.1はどちらを選ぶべきですか?
A: 商用利用の手軽さではSD3.5(年商100万ドル以下は無料)、プロンプト解釈力ではFLUX.1が優れています。SD3.5はA1111での動作実績もありますが、FLUX.1はForge/ComfyUI専用です。どちらも試して比較することをおすすめします。
おすすめ書籍
画像生成AIの基礎から応用まで体系的に学びたい方におすすめの一冊です。
『画像生成AI Stable Diffusion スタートガイド』 AICU media(2,640円)
Stable Diffusionの導入から実践的なテクニックまで、初心者でもわかりやすく解説されています。
関連記事:
– 【2026年最新】画像生成AI徹底比較|Midjourney・GPT-4o・Stable Diffusion・にじジャーニー
– 【超初心者向け】Stable Diffusionのインストール方法|PC環境構築から使い方まで
– Stable Diffusion拡張機能おすすめ10選|品質向上・効率化ツール
– Stable Diffusion XL(SDXL)完全ガイド|導入から実践まで


コメント