【制作記録】LoRAなし・素材不足の逆境をどう攻略したか?「女性警察官×サスペンス」案件の技術構成を全公開

副業・資産形成

おおきに、黄昏(タソガレ)です。

今日はな、先日納品したある案件で、俺がぶち当たった「壁」と、それをどうやって「ロジック」でぶち壊したか──その全記録を共有するで。

「依頼主の要望を120%で叶えたいけど、手持ちの素材が全然足らん」

そんな時、あなたならどうする?諦めるか?それとも、知恵絞って戦うか?

これは、AI生成を「運ゲー」から「技術」に変えるための、俺からの提案や。

1. プロローグ:届いた一通のメッセージが、全ての始まりだった

それは、いつもと変わらない平日の夕方やった。

パソコンの前で、納品済み案件のフィードバックを確認してたら、ピロン、と通知音が鳴った。新しい依頼や。

開いてみると──

「女性警察官が主人公のサスペンス作品を企画しています。緊張感のあるシーンを何枚か制作していただきたいのですが、可能でしょうか?できれば、アニメっぽすぎず、かといって実写でもない、リアルとフィクションの中間のような質感で……」

おお、これは面白そうやないか。

サスペンス。警察官。緊張感。質感のコントロール──どれも俺が得意とする領域や。即座に「やります」と返信した。

……が、しかし。

依頼主から送られてきた「参考資料」を開いた瞬間、俺の顔は凍りついた。

⚠️ 最大の難所が判明

学習用の画像素材が、たったの3枚しかない。

しかも、それぞれ異なるアングル、異なる表情、異なる衣装……つまり、LoRA(追加学習モデル)を作成するには圧倒的に素材不足という状況や。

通常、AIで特定のキャラクターを安定して生成するには、最低でも15〜20枚の学習素材が必要や。それを、LoRAという追加学習モデルに仕込むことで、「このキャラはこういう顔、こういう髪型」という情報をAIに覚え込ませるんや。

せやけど、今回はそれができへん。

ここで諦めるか?

──いや、待て。俺は何のためにこの仕事をやってるんや?

「できません」で終わらせるのは簡単や。でもな、制約こそが、クリエイターの真価を試す舞台やないか。

💭 ここで思い出した、ある名言

「立って歩け。前へ進め。あんたには立派な足がついてるじゃないか」 ── エドワード・エルリック(鋼の錬金術師)

そうや。俺には「Stable Diffusion」という、最強の足があるやないか。

LoRAがない?上等や。その分、自分の工夫と設定値でカバーしたるわ。

こうして、俺の孤独な戦いが始まった。

2. 第一の試練:「素材がない」は言い訳にならん!制約こそが腕の見せ所や

まず最初に整理したんは、今回のミッションの「核心」や。

📝 今回の制作ミッション

  • テーマ:女性警察官のサスペンス連作(5〜8枚程度)
  • 求められる質感:アニメでも実写でもない「セミリアル」
  • シーンの要求:襲撃、尋問、緊迫、焦燥……感情表現の幅が必要
  • 最大の障壁:LoRAが作れない(学習素材が3枚のみ)

ええか、よう聞け。

ここでの正解は「素材がないから出来ません」と断ることやない。「LoRAという武器を捨てて、基礎基本のモデル選定とプロンプト構成だけで勝負する」ことなんや。

なぜか?

それは、AIの本質は追加学習だけやなくて、ベースモデルのポテンシャルをどこまで引き出せるかにあるからや。

🏋️ これって、何に似てる?──筋トレとFPSゲームの例え

わかりやすく例えるで。

これな、筋トレで言うたら「プロテインもサプリも切らしてるけど、白飯と鶏むね肉だけでバルクアップせなアカン」状態と一緒や。

あるいは、FPSゲームで「最強武器(メタ武器)」がナーフされて、初期ハンドガンだけでランクマ戦うようなもんやな。

「道具が悪い」言うて負けても、誰も慰めてくれへんで?

プロは、どんな制約下でも結果を出すもんや。

せやから俺は決めた。LoRAなしで、この案件を完遂する、と。

✨ ここで得た教訓

AI生成は「LoRAがあれば楽勝」という話やない。
基礎基本のモデル理解とプロンプト設計こそが、全ての土台なんや。
制約を言い訳にした瞬間、あんたの成長は止まる。

3. 第二の試練:戦うための武器選び(Tech Stack)と「ADetailer」の魔法

さて、ここからが本番や。

LoRAなしで戦うと決めた以上、「何を使うか」「どう設定するか」が全てや。

俺が最終的に組んだ「デッキ構成」は、これや。

🛠️ 今回の技術スタック(使用ツール・設定)

  • ベースモデル:Pony Diffusion XL V6
  • 拡張機能:ADetailer(顔面補正)
  • Steps:28
  • CFG Scale:7.0〜8.0
  • Denoising strength:0.35〜0.4

🎯 なぜ「Pony Diffusion XL V6」なのか?

結論から言うで。

Ponyは、プロンプトへの「従順性」がダンチや。

「襲撃」「焦り」「衣装の乱れ」「血痕」「雨に濡れた髪」……こういう複雑で細かい指示を、正確に画像に反映させるには、Ponyの理解力が必要不可欠なんや。

他のモデルやと、プロンプトを盛りすぎると「なんかそれっぽい雰囲気」で誤魔化されることが多い。せやけどPonyは違う。一つひとつの単語を丁寧に拾って、画像に落とし込んでくれるんや。

🔧 「ADetailer」──崩れた顔を物理的に矯正する魔法

そして、もう一つの秘密兵器が「ADetailer」や。

これは何かって言うと、生成後の画像の「顔」だけを自動検出して、もう一度高品質に描き直してくれる拡張機能や。

どんなに優秀なモデルでも、複雑なシーン(例えば、暗闇で走ってる警察官、とか)を描かせると、顔が崩れることがある。目の位置がおかしい、鼻が二つある、口が溶けてる……みたいなホラー展開や。

せやけど、ADetailerを使えば、そういう「事故」を後から物理的に修正できるんや。

🍳 料理で例えるなら?

ADetailerは、「仕上げの飾り付け」みたいなもんや。
メイン料理(全体の構図)がどんなに完璧でも、皿の上に髪の毛が一本乗ってたら台無しやろ?
ADetailerは、その「最後の仕上げ」を完璧にしてくれるツールなんや。

⚙️ 設定値の「火加減」──Denoising strengthの罠

ここで、一つ重要な話をするで。

Denoising strength(ノイズ除去強度)という設定値があるんやけど、これが曲者なんや。

Denoising strength: 0.35 〜 0.4 ※ここ、テストに出るで。 0.5以上に上げたら、AIが幻覚見始めて変な線描きよるからな。

この数値は、「どれくらい元の画像を変えるか」を決める値や。

  • 低すぎる(0.2以下):ほとんど変化しない。顔の修正が弱い。
  • 高すぎる(0.5以上):AIが暴走して、元の画像と全く違うもんを描き始める。
  • ベスト(0.35〜0.4):元の雰囲気を保ちつつ、顔だけキレイに修正される。

🔥 料理で言う「火加減」の話

Denoising strengthを上げすぎるのは、強火で肉焼きすぎて黒焦げにするのと一緒や。
「よかれと思って」やりすぎたらアカン。
適度な火加減(0.35)でじっくり攻めるんが、旨い絵を作るコツなんやで。

💡 科学的アプローチ──名言に学ぶ

「唆(そそ)るぜ、これは……!テメーらの足元にあるのは、神ごっこの奇跡じゃねえ。地道な科学の基礎だ!」 ── 石神千空(Dr.STONE)

AIは魔法やない、科学や。

設定値の一つひとつに意味があるんや。なんとなくでスライダー動かしてんじゃねえぞ。

千空みたいに、仮説立てて、検証して、自分だけの「正解」を掴み取れや

4. 第三の試練:「セミリアル」という質感の錬金術

さて、最後の仕上げは「画風」のコントロールや。

依頼主が求めてたんは、アニメでも実写でもない、「シリアスな質感」やった。

これをどうやって実現したか?

🎨 プロンプトで「混ぜる」技術

LoRAなしでこれを実現するために、俺が使ったんは「プロンプトの重み付け」や。

Positive Prompt(入れたい要素): (photorealistic:1.1), (dry skin:1.4), (anime face:1.3) Negative Prompt(入れたくない要素): (overly smooth skin:1.5), (cartoon:1.3), (full 3D render:1.2)

これ、何をやってるかって言うと──

  • (photorealistic:1.1) → 写真のような「生々しさ」を少しだけ加える
  • (dry skin:1.4) → 肌の質感を「ツルツル」じゃなくて「少しカサついた感じ」にする(リアルさの演出)
  • (anime face:1.3) → でも顔の造形だけは、2次元キャラクターっぽく引き戻す

この「1.4」とか「1.3」の重み付けこそが、命や。

🍺 居酒屋のハイボールで例えるなら

🥃 絶妙な配合が人の心を動かす

居酒屋で「ハイボール濃いめ」頼む時の感覚に似てるな。
「ウイスキー多めで、炭酸は少なめ」。
この絶妙な配合が、客(依頼主)を酔わせるんや。
「普通でええわ」なんて思考停止で作ったもんが、人の心に刺さるわけないやろ?

1.1倍か?1.2倍か?そのコンマ1の差に、お前の魂が宿るんや。

📊 実際の生成プロセス(タイムライン)

ここで、実際の制作の流れを時系列で紹介するで。

⏱️ 制作タイムライン

  1. 0日目(企画):依頼内容の確認、LoRA作成不可を判断
  2. 1日目(テスト):Ponyモデルでテスト生成20枚、質感の方向性を探る
  3. 2日目(調整):プロンプト重み付けを微調整、Denoising strengthを0.35に確定
  4. 3日目(量産):本番生成、約50枚から依頼主の要求に合う8枚を選出
  5. 4日目(仕上げ):ADetailerで顔面補正、最終チェック後納品

トータル作業時間は約12時間。LoRAがあれば半分で済んだかもしれん。

せやけど、この「遠回り」が、俺の技術を一段階引き上げてくれた。

🏐 上を向くスポーツ──ハイキューの教え

「下を向くんじゃねえ!!! バレーは(制作は)!!! 常に上を向くスポーツ(作業)だ」 ── 烏養コーチ(ハイキュー!!)

完成品見て「なんか違うな」で終わらすな。

1.1倍か?1.2倍か?そのコンマ1の差に、お前の魂が宿るんや。

依頼主から「すごい!どうやってるんですか?」言われた時の快感……味わいたくないんか?

ほな、やるしかないやろ!今すぐWebUI開いて、数値を刻め!

5. エピローグ:技術は、諦めない者の手の中で光る

納品から数日後。

依頼主からメッセージが届いた。

「想像以上の仕上がりで、本当に感動しました。LoRAが使えない状況でここまでのクオリティを出せるとは思っていませんでした。ありがとうございます。また次回もお願いします」

……泣きそうになった。

せやけど同時に、確信した。

「制約」は、言い訳の材料やない。むしろ、技術を磨くための「砥石」なんや。

🌟 この案件から得た3つの学び

  1. LoRAは万能やない:基礎(モデル選定・プロンプト設計)が全ての土台
  2. 設定値は科学:一つひとつの数字に意味があり、検証が必要
  3. 制約こそチャンス:できない理由を探すより、できる方法を探せ

🔥 あなたへのメッセージ

もしあなたが今、AI生成で壁にぶつかってるなら──

もしあなたが「素材がない」「LoRAが作れない」「うまくいかない」と悩んでるなら──

この記事を読んでくれたことが、あなたの「足」になる

俺が戦った道のりを、あなたも歩ける。いや、歩いてくれ。

💪 今すぐできるアクションプラン

  • Pony Diffusion XL V6をダウンロードして、テスト生成してみる
  • ADetailerを導入して、顔面補正の威力を体感する
  • Denoising strengthを0.3、0.35、0.4、0.5で比較生成してみる
  • プロンプトの重み付け(:1.1、:1.2、:1.3)を自分で試す

AI生成は「運ゲー」やない。

技術と知恵と、諦めない心があれば、必ず道は拓ける

さあ、あなたの戦いを始めようや。

俺はここで、あなたの成功を祈ってるで。

おおきに、ほな、また。

── 黄昏(タソガレ)

コメント