AOYAMA Koji's プログラミングブログ - プログラミングを楽しく体験

【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】プログラマー向け実装解説

2026/02/02
【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】

 ChatGPT(gpt-image-1)による画像生成プロンプトの調整過程を解説します。 少ない指示でも自律的に構図を補完し、勝手にエンタメ性の高い「映える」絵に仕上げる強みと、指定したキャラクターが欠落する課題を実例で共有します 。
 最終的には Gemini (gemini-3-pro-image-preview) を使用していますが、ChatGPT での試行錯誤の共有が、AIによる画像生成時の参考になりましたら幸いです。

 本ゲーム実装は『キャラAIバトルロイヤル』実装概要に記載していますので、併せてご参照ください。

【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 キャラAIバトルロイヤル  ゲーム本体は『キャラAIバトルロイヤル』でプレイ可能ですので、 ぜひ新ジャンル「AI判定ゲーム」を体験してみてください。



【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】

プログラミングブログ記事一覧


[PR]

【画像生成AI比較】「映える」ChatGPTと「網羅する」Gemini


 最初に結論として、ChatGPT (gpt-image-1) と Gemini (gemini-3-pro-image-preview) の画像生成機能の評価および特徴を比較します。
 ここでの比較は、単なる機能テストや「動かしてみた」レベルのものではありません。 『キャラAIバトルロイヤル』を実際に運用・商用提供するという前提の下、 「商業ベースで耐えうるコストパフォーマンスとクオリティー」というシビアな基準で、 徹底的な選定を行ったものです。

ChatGPT (gpt-image-1):勝手に映える自律的な演出力

 ChatGPT (gpt-image-1) による画像生成の最大の特徴は、「指示以上の演出を勝手に加えてくれる」という自律性の高さにあります。 少ない指示でも自律的に補完し、エンターテインメント性の高い「映える」絵を生成してくれます。
 一方で、指定キャラクターを全員描いてくれないなどの厳密なルールを守らせる点には課題がありました。
 『キャラAIバトルロイヤル』における画像生成は、決勝グループに残ったキャラクターの召喚者、つまりプレイヤーの皆さまへのご褒美の意味があるため、 この課題は大きな意味を持ちます。
 結論としてはGeminiを採用しました。

Gemini (gemini-3-pro-image-preview):全要素を拾い上げる正確な網羅性

 Gemini (gemini-3-pro-image-preview) による画像生成の最大の特徴は、「正確な網羅性」にあります。 指定した要素をすべて画像に反映する完遂力は極めて優秀です。
 一方で、自律的にエンターテインメント性の高い演出を加えることはありません。 ランダムな配置を指示しても均等に整列させてしまうなど、むしろ「自律的に説明資料のような構成にする」という強い傾向があります。
 『キャラAIバトルロイヤル』はゲームであり、描いているのは決勝グループに残ったキャラクターたちの、熱いバトルシーンです。 求めているものは説明資料ではなく、心躍るエンターテインメント性です。
 ただし、時間はかかりましたが、キャラクター配置などをより具体的かつ詳細に指示することで、この特性を制御し、採用可能なクオリティーまで引き上げることができました。 キャラクター欠落のない信頼性は保てており、最終的には Gemini を採用しています。

画像生成プロンプト ChatGPT (gpt-image-1) 編


 ChatGPTを用いた画像生成プロンプトの調整結果は以下の通りです。 プロンプトとは、AIに対する指示のことです。 使用AIモデル名は gpt-image-1 です。
 このプロンプトには満足していますが、この完成後に Gemini3 が発表され、そちらを使うことにしたので、このプロンプトは最終的には使用していません。 ご了承ください。
=== Character List (Japanese) ===
###REPLACE_CHARACTER###
=== Battle Commentary (Japanese) === ###REPLACE_LIVE###
=== Requirements === - Detailed high fantasy architecture and landscape - Include all characters: winner in center (largest, brightest), runner-up (larger) facing the winner, all others somewhere in the scene; intense combat action with shining VFX - Characters brightly lit with vivid colors, clean rendering with subtle shadows; each reflects their description, non-fantasy genres welcome - Human characters youthful, slender and graceful - Diverse characters of various genders - Do not include any text or letters in the image - Content appropriate for all ages, no explicit violence, sexual content, or disturbing imagery
=== This Image === A Conceptual battle scene created as an award for players who created these character descriptions Depict all listed characters, none missing

【動的プロンプト解説】パラメーター置換と日本語リストの扱い


###REPLACE_CHARACTER###

 ###REPLACE_CHARACTER### には、キャラクターリストが入ります。以下の形です。 winnerは優勝者、runner-upは準優勝者です。 タイプと説明は日本語のままです。
- (winner) "タイプ" "説明"
- (runner-up) "タイプ" "説明"
- "タイプ" "説明"
- "タイプ" "説明"
   :

###REPLACE_LIVE###

 ###REPLACE_LIVE### には実況が入ります。日本語です。 バトル結果の先頭に表示される文言です。

画像生成プロンプトの作成の流れ


 画像生成プロンプトは、結果的にというところもありますが、以下の流れで進めました。
  1. ChatGPT との対話であたりを付ける
  2. モデル gpt-image-1-mini で調整する
  3. 上位モデル(gpt-image-1) を使用する(感動)
  4. (結果的に) Gemini3 に差し替える

 以下で解説します。

1. まず ChatGPT との対話であたりを付ける


 まずは対話形式で検証して、ChatGPT(gpt-image-1)による画像生成に対してあたりを付けました。
 ここでは、AIが既存の有名作品の雰囲気を勝手に反映してしまう傾向が見られました。 魅力的ではありますが、権利的な安全性を考慮するとコントロールが必要です。

権利的に心配な絵が完成


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 権利的に心配(モザイク加工あり)  最初にできあがったのは、スタジオジブリがドラゴンクエストを描いたらこうなりそう、と思う絵でした。
 厳密には著作権侵害では無いのかもしれませんし、正直なところ魅力的ですが、筆者はゲーム業界に長くいるからか直感的に危険性を感じ、使いたくないと思いました。
 なおここでは念のためモザイク加工して紹介していますが、元絵はクリアでした。

著作権侵害の懸念は軽減した絵を生成


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 著作権侵害の懸念を軽減  次に権利的に安全にしてもらいました。
 しかし人間が描いたような絵は、もしかするとどなたかの絵を真似てしまっているかもしれません。 だから、著作権侵害の懸念は軽減されているかもしれませんが、ハッキリ大丈夫とは言えません。
 また、こうした絵の魅力は、描く人の魅力だと思いますので、この方向で進めるのは難しそうと気づきました。

リアル調の絵に感動


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 リアル調に  絵柄の指示を明示して、リアル調にしてもらいました。
 これ、良いですよね。 筆者はめっちゃいい!と感じました。

各キャラクターに攻撃動作をさせて一区切り


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 攻撃動作  絵柄はそのまま、各キャラクターに攻撃動作をさせるようにしました。
 この方向で良さそうなので、いったん、ChatGPTのチャットでの検証は終了しました。

2. モデル gpt-image-1-mini で多数の試行錯誤


 ChatGPTのチャットでの検証であたりがついたので、本格的に API を使用して検証開始しました。 使用するモデルは gpt-image-1-mini
 軽量モデルですが、十分に良い絵が描けるので、コストを抑えるためにこちらを使用する想定で進めます。

API使用でサンプル作成


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 API使用  まずはAPIを使用してみました。
 サイズに制限があるので、1024x1024の正方形で製作を指示。 最初からそれなりに満足度の高い絵ができました。

プロンプト解釈力を補うため英語を使用


 プロンプトは、今まではすべて日本語で書いていましたが、ここから英語にしました。
 gpt-image-1 および gpt-image-1-mini は、プロンプトの解釈能力が低いため、英語で指示した方がベターだからです。 また、長文理解も弱いので、できるだけ簡潔にまとめることにしました。
 そのため生成AIの Anthropic Claude に翻訳してもらいながら進めました。 英文の一部を解説します。

ハイファンタジーの背景

 Detailed high fantasy architecture and landscape で、筆者の望む、ハイファンタジーと呼ばれるジャンルの絵柄の建造物と風景を指定します。 detailed(詳細な)が無いと、抽象的な背景になっていました。

ジャンル違いを許容し多様なキャラを可能に

 each reflects their description, non-fantasy genres welcome で、キャラクター説明に合わせて絵を書いてね、ファンタジーじゃなくても歓迎だよ、と指示しています。 これをしないと、ファンタジージャンル以外のキャラクター、例えばサッカー選手とかが、描かれなくなる確率が上がります。
 多様なキャラタイプを許容したいので、この指示を入れています。

ポリコレ意識と全年齢対象の商用提供

 Diverse characters of various genders により多様な性別を、 Content appropriate for all ages, no explicit violence, sexual content, or disturbing imagery により全年齢向けを指定しています。
 商用提供のゲームとして、問題ないように指示しておきます。

テキスト禁止

 Do not include any text or letters in the image にてテキスト描画を禁止しています。 検証中に何度かキャラクタータイプ等が絵の中に書かれることがありましたが、読めない漢字の確率が高いので、「書かないで」と指示しています。

VFX追加してゲーム画像っぽく


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 VFX追加  APIで生成できるようになり、英語での指示も整いましたので、絵のクオリティーの追求を始めました。 まずはVFXを追加。
 英語の指示は、戦闘モーションと合わせて intense combat action with shining VFX です。 良い感じになりました。

「シュッとした若者」を生成AIに伝える英語表現【Tips】


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 シュッとした若者に  特に指定をしないとごっついおっさんになるので、シュッとした若者と指定しました。
 「シュッとした若者」の英語はAIと相談して Human characters youthful, slender and graceful としています。 直訳すると「人間タイプのキャラクターは、若く、細く、美しく」といったところです。
 余談ですが、筆者が以前見た、史実に基づいた米国製映画では、実在した主人公は華奢な若者なのに、 映画では筋肉隆々の中年の俳優さんが演じていました。 つまり多くの米国人にはその方が受けが良く、AIもそれに寄せているものと個人的には考えています。
 ただ日本のゲームやアニメは少年少女が主人公のことが多く、筆者もその方が好きなため、シュッとした若者にしました。
 併せて Characters brightly lit with vivid colors, clean rendering with subtle shadows として、 色鮮やかなコンピューターグラフィックスのような絵を指定します。

優勝キャラクターを中央にするレイアウト調整


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 レイアウト調整  優勝者を明示するため、優勝キャラクターを中央、としました。
 英語の指示は winner in center (largest, brightest), runner-up (larger) facing the winner, all others somewhere in the scene です。 良い感じです。

意図しない絵が頻度高く発生【課題】


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 意図せずアニメ調に  前述の例は、良いところを取り出していますが、gpt-image-1-mini は、結果にかなりブレがあります。 例えばこの絵のように、意図せずアニメ調になったりします。
 まあ、これくらいなら、権利的な心配を除けば、揺らぎとして楽しめる範囲かもしれませんが…


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 7人のハズが4人半  こちらは、他の例と同様にキャラクターリストに7人指定しているのですが、描画されたのが4人(と腕だけ)になった例です。
 キャラクター作成者へのご褒美画像だから絶対全員描いてね!という意図で A Conceptual battle scene created as an award for players who created these character descriptionsDepict all listed characters, none missing を入れているのですが、 誰かがいなくなる頻度は高く、検証の間、全員いる確率は半分も無かったと思います。
 また、単語を少し変えたり、文章が長くなると、解釈が変わって明確に表示されなくなるキャラクターが出る状態でした。 解釈力不足が露呈していて、 gpt-image-1-mini の限界だと感じました。

3. 上位モデル(gpt-image-1) に変更し感動的な満足感を得る


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 gpt-image-1画像その1  前述の限界を感じて、画像生成AIモデルを gpt-image-1 に変更しました。
 最初に試して完成した絵がこれ! プロンプトは同じですが、演出クオリティーが劇的に向上し、クオリティーの高い絵になりました! 感動です!これは大満足!


【技術解説】ChatGPTの画像生成はエンタメ性が高い!プロンプト構築とキャラ欠落の課題【キャラAIバトルロイヤル】 gpt-image-1画像その2  別シチュエーションでも描いてもらったところ、やはり高クオリティーです。 コストは5倍ですが、もう gpt-image-1-mini には戻れません。


 gpt-image-1-mini でも、特別な指示なしで良い感じの位置関係になりましたが、 gpt-image-1 ではさらにクオリティーの高い、最高の1枚が仕上がります。
 特筆すべきは、プロンプトで細かく指定しきれない背景の奥行きや、戦場の空気感をAIが自律的に判断し、勝手にドラマチックな絵に昇華させてくれる点です。 この自律的なエンタメ構成力こそが、ChatGPT画像生成モデルの最大の魅力だと感じました。
 しかし、一部のキャラクターを省略してしまう頻度は、gpt-image-1-mini ほどではありませんが、gpt-image-1 でも無視できない程度にはありました。 やはり「勝手に」構成を判断する性質上、この傾向はあるのでしょう。

4. (結果的に) Gemini3 に差し替えてキャラクター欠落を回避


 結論としては、このプロンプトは使用せず、 Gemini3 を使うことにしました。
 gpt-image-1 を使用して、かなり満足度の高い状態になりました。 しかし、時々キャラクターが欠ける問題は残ります。
 この画像は、決勝グループに残ったキャラクター召喚者への、つまりプレイヤーの皆さまご褒美としての意味があります。 冷静に考えると、この問題は致命的とも言えます。
 Gemini3 登場のニュースが舞い込んできたのは、そこを悩んでいたタイミングでした。 結論としては、そちらで試行錯誤して、差し替えることに決めました。
 Gemini3 のプロンプトと詳細については、記事を分けて解説します。 不足しているエンタメ性を、プロンプト側で補う形になります。
[PR]

まとめ


 キャラAIバトルロイヤルChatGPT画像生成プロンプトの解説をしました。
 このプロンプト完成後に Gemini3 が発表され、 結論としてこちらは使用しなくはなりましたが、良い絵にも良い経験になりましたので、記事として共有しました。
 少しでも皆さまの画像生成プロンプト作成の参考になりましたら幸いです。

補足

  • 記事の校正/添削に生成AIの Anthropic Claude を利用しております。
  • 記事の校正/添削に生成AIの Google Gemini を利用しております。
  • 記事内の画像の作成に生成AIの OpenAI ChatGPT を利用しております。
  • 画像内のラスタライズ文字フォントにOpen Font LicenseNoto Sans Japaneseを使用しております。
  • ※各社の登録商標または商標について「®」「™」等の表記はしておりません。

カテゴリー:プログラミング解説,キャラAIバトルロイヤル
[PR]