【技術解説】実践検証：API用 AIモデル比較【キャラAIバトルロイヤル】

2026/01/26

　API経由で利用可能な各社AIモデル比較 (AI Model Comparison) の解説記事です。 ChatGPT(GPT-5)、Gemini、Claude等の料金・性能・思考トークンの違いを検証し、『キャラAIバトルロイヤル』開発において最適な AIモデルを選定した理由をレポートします。

　本ゲーム実装は『キャラAIバトルロイヤル』実装概要に記載していますので、併せてご参照ください。

【技術解説】実践検証：API用 AIモデル比較【キャラAIバトルロイヤル】キャラAIバトルロイヤル

　ゲーム本体は『キャラAIバトルロイヤル』でプレイ可能ですので、ぜひ新ジャンル「AI判定ゲーム」を体験してみてください。

プログラミングブログ記事一覧

プログラミングブログ(109)

ごあいざつ(2)

ブログ開設ごあいさつ(1)

リニューアル報告(1)

Webアプリケーション(29)

キャラAIバトルロイヤル(1)

自動生成☆詰将棋(13)

レベル1：基本の1手詰(1)

レベル2：金銀の1手詰(1)

レベル3：金銀歩の1手詰(1)

レベル4：金銀桂歩の1手詰(1)

レベル5：金銀桂香歩の1手詰(1)

レベル6：本格的な1手詰(1)

レベル7：ワイドエリアの1手詰(1)

レベル8：中空玉の1手詰(1)

レベル9：自陣エリアの1手詰(1)

レベル12：金銀の3手詰(1)

レベル16：本格的な3手詰(1)

レベル自由：カスタム詰将棋(1)

詰将棋ソルバー(1)

mp4クリエイター(9)

横うねうね(1)

横うねうねバリエ(1)

横フリフリ(1)

バウンズーム(1)

回転ぐるぐる(1)

多重横スクロール(1)

多重縦スクロール(1)

2点むにむに(1)

グロッサリーチェッカー(1)

ベンチマーク(1)

スイスドロー対戦マッチングツール(1)

XML+XSLビューアー(公的機関書類確認)(1)

資産運用：積立計算ツール(2)

つみたてNISA逆算ツール(1)

Webアプリケーション実装解説(29)

当ブログ全般(1)

コーディングルール(1)

キャラAIバトルロイヤル(9)

実装概要(1)

AI API プログラミング(1)

AIモデル比較(1)

画像生成ChatGPT編(1)

画像生成Gemini編(1)

不適切キャラ除去(1)

序盤戦：スコア付け(1)

中盤戦～終盤戦(1)

決勝戦(1)

自動生成☆詰将棋(10)

[コラム]基礎実装とAIの変遷(1)

[コラム]ゲームの進化と最新AI(1)

[コラム]カリキュラム学習(1)

[コラム]合い利かず判定(1)

[コラム]生成を収束させる工夫(1)

ゲームのBGリードでUX向上(1)

1次元座標変換による高速化(1)

バイナリ化による高速化(1)

UXから逆算した非対称最適化(1)

テスト駆動パフォーマンス向上(1)

モンテカルロ法【スイスドロー】(1)

つみたてNISA逆算ツール(1)

Mp4ファイル生成解説(5)

エンコード(1)

NAL Unit取得(1)

BOX構築(1)

ファイル保存(1)

内容閲覧ツール(1)

サンプリング周波数試聴ツール(2)

プログラミング解説(1)

プログラミング解説(27)

プログラミングを始めよう(2)

プログラミンとは(1)

プログラムの演算(1)

絵が動くゲームを作ってみよう(10)

【完成形】メガホンDEポン(1)

絵を動かす(3)

絵を動かす基礎(1)

10fpsで絵を動かす(1)

上下左右の壁で跳ね返す(1)

UI(2)

プレイヤー操作で動かす(1)

スワイプ操作(1)

ゲーム仕様(4)

矩形の当たり判定(1)

円と円の当たり判定(1)

当たって跳ね返す(1)

スコアアップ(1)

コンピューターの内部動作(2)

計算精度(1)

ブロッキングとノンブロッキング(1)

数学の活用(6)

円の動きを表現(1)

円周率算出基礎(2)

円周率算出高速化(1)

当たり判定(3)

絶対値と2乗の平方根(1)

円と円(1)

跳ね返し(1)

データ圧縮・伸張(7)

音声圧縮体験ツール(2)

周波数成分への分解と合成(1)

データ圧縮の基本(5)

音声圧縮体験ツール(1)

高速フーリエ変換FFTが高速な理由(1)

メモリーを無駄遣いしない実装(1)

マルチスレッドで高速化(1)

その他の技術解説(5)

ネットワーク(3)

サーバー(2)

ドメインとフィッシングサイト(1)

ドメインとホスト名(1)

端末・クライアント(1)

GIP表示ツール(1)

グラフィックス(2)

SVG(2)

SVG基礎(1)

SVG途中から表示(1)

マネージメント(1)

プログラマー採用術(1)

ロジカルな推し解説(15)

オーディオ(13)

音声データ(1)

音楽配信サービス(1)

スマートフォン用イヤホン環境(11)

オーディオコーデック(1)

Bose完全ワイヤレスイヤホン(1)

LDAC対応完全ワイヤレスイヤホン(1)

LDACトランスミッター(1)

ハイエンド有線イヤホン(1)

4.4mmバランス接続とは(1)

バランス接続携帯DACで音質向上(1)

OTGケーブルは相性問題に注意(1)

イヤーピース交換でさらに音質向上(1)

バランス接続リケーブル(1)

室内視聴環境(1)

Exofield(1)

社会・生活(2)

資産運用(1)

ドルコスト平均法が利益を出しやすい理由(1)

メディア(1)

メディアの真実と事実(1)

アイコン説明

全員向け
プログラミングを始めたい人・初心者向け
初中級者向け・一般プログラミング解説
プログラマー向け・実装解説

[PR]

API利用時の AIモデル (AI Model) 選定のポイント

　プログラムからAPI経由でAIを呼び出す場合、用途に合わせた AIモデルの指定が必要です。モデルごとに性能や料金、思考プロセスの有無が異なるため、以下の表で比較、解説します。

【料金表】API用 AIモデル比較・思考トークン一覧(GPT/Gemini/Claude)

モデル名

/出力MTok

思考Tok

gpt-5-pro

$120

必須

gpt-5

$10

必須

gpt-5-mini

必須

gpt-5-nano

$0.4

必須

gpt-4o

$10

gpt-4o-mini

$0.6

gemini-3-pro-preview

$12

必須

gemini-2.5-pro

$10

必須

gemini-2.5-flash

$2.5

必須

gemini-2.5-flash-lite

$0.4

claude-opus-4-5

$25

任意

claude-sonnet-4-5

$15

任意

claude-haiku-4-5

任意

claude-opus-4

$75

claude-sonnet-4

$15

claude-haiku-3-5

　この表は、筆者が詳細に調査した2025年12月時点での主要なAIモデル比較です。モデルごとに、料金と思考トークンに関して一覧しています。
　以下で各用語を解説します。各社AIモデルの性能詳細は後述します。

出力トークンとは

　出力MTokは、M(100万)の出力Tok(出力トークン)です。これはAIの回答に含まれるトークンです。
　トークンとは、テキスト文章を意味のような単位に分解したものです。日本語1文字あたり1～3トークンです。単純に書けば、日本語1000文字で500トークン程度です。
　ただし、各モデルでトークン分解方法が異なり、まったく同じ文章でもトークン数は異なります。筆者が試用した範囲ですと、新しいモデルほどトークン数が少なくなる傾向にあります。
　表の「/出力MTok」は「100万出力トークンあたり」を意味します。

AI利用料金の計算方法

　ここで、例えばAIの回答が 1000出力トークンだったとします。これは100万トークンの $ \frac{1}{1000} $　です。
　表の gpt-5-pro を見ると $120 とありますので、その $ \frac{1}{1000} $　は $0.12 です。 $1≒150円とすると、約18円程度。
　つまりその回答を得るのに約18円かかります。
　gpt-4o-mini なら $0.6 の $ \frac{1}{1000} $ つまり $0.0006(約0.09円)なので、かなり安価です。

思考トークンとは

　思考Tok(思考トークン)は、内部で思考するために必要なトークンです。
　表に「必須」と書かれているモデルは思考トークンが必要です。基本的に出力トークン料金が、思考トークンの量に応じて追加で必要です。
　「-」は、そのモデルでは思考トークンを使用しないことを表します。つまり思考が深い処理でも、出力量を最小限にすれば、料金を抑制できます。
　「任意」とは、思考トークンを使用するかどうかをオプションで選べることを表します。デフォルトでは使用せず、オプションで指定すると深く思考するようになり、料金と時間もかかるようになります。
　つまり gpt-5 と gpt-4o は同じ $10 に見えますが、 gpt-5 は思考トークンが必須、gpt-4o は使用しないため、 gpt-5 の方が高額になります。
　実際にどのくらい思考トークンが必要なのか不明なため、料金が青天井に見えます。筆者が確認した範囲では、入力1000トークンに対し、同等以上の思考トークンが消費される傾向にあります。 AIモデル比較においては、この「隠れたコスト」の考慮も重要です。

gemini-2.5-flashの補足

　チャットのGeminiからは、gemini-2.5-flash は思考トークンをデフォルトでは使用せず、上限数が設定できると聞きました。つまりこの表で「任意」のハズです。しかし実際に試したところ、デフォルトで思考トークンを使用し、抑制できませんでした。そのため思考トークン「必須」としています。
　おそらく以前は任意だったものと思われます。状況は日々変化している可能性があります。

入力トークンとは

　入力トークンは、プロンプトつまりAIへの指示テキストに基づきます。
　入力トークンにもお金がかかりますが、出力トークンの1割程度なので、料金視点で重要なのは出力トークンと思考トークンです。

各社 AIモデルの特徴と実践検証結果

　各社AIモデルの技術的な位置付けと、筆者による実践検証の結果を解説します。
　ここでの検証は、単なる機能テストや「動かしてみた」レベルのものではありません。『キャラAIバトルロイヤル』を実際に運用・商用提供するという前提の下、 「商業ベースで耐えうるコストパフォーマンスと精度」というシビアな基準で、徹底的な選定を行ったものです。
　なお、本記事で言及していないAIモデルについては、スペック上の料金メリットが薄い等の理由から、今回の採用・検証候補からは外しています。

ChatGPT

モデル名

概要

gpt-5-pro

現世代・高性能版

gpt-5

現現世代・メイン

gpt-5-mini

現世代・軽量版

gpt-5-nano

現世代・超軽量版

gpt-4o

前世代・メイン

gpt-4o-mini

前世代・軽量版

　OpenAI ChatGPT の代表的なAIモデルです。

gpt-4o-mini

　筆者が試用する限り gpt-4o-mini は性能十分で、費用対効果が高く、魅力的です。
　ただし『キャラAIバトルロイヤル』において何度も試用したところ、全員が自分の必殺技にやられて敗退するなど、不適切な回答になる場合があり、使用を断念しました。

Gemini

モデル名

概要

gemini-3-pro-preview

gemini-2.5-flash

　筆者が試用する限り、gemini-2.5-flash　は性能十分です。
　『キャラAIバトルロイヤル』の試用でも特に大きな問題はありませんでした。ただし思考トークンが必要なことが、試用回数を重ねた後に発覚し、採用を断念しています。

gemini-2.5-flash-lite

　gemini-2.5-flash-liteは、例えば『キャラAIバトルロイヤル』の不適切キャラの除外シーケンス(後日プロンプト公開予定)で内容に関係なく全キャラ除外してしまうなど、指示の意図から外れた回答になることが多く、使用を断念しました。

Claude

モデル名

概要

claude-opus-4-5

現世代・高性能版

claude-sonnet-4-5

現世代・メイン

claude-haiku-4-5

現世代・軽量版

claude-opus-4

前世代・高性能版

claude-sonnet-4

前世代・メイン

claude-haiku-3-5

前世代・軽量版

　Anthropic Claude の代表的なAIモデルです。

claude-haiku-4-5

　筆者が試用する限り claude-haiku-4-5 で性能十分です。
　ただし『キャラAIバトルロイヤル』において何度も試用すると、JSONの {} の数が合わないことがありました。さらに、リトライしてもその状態が連続してしまい、指定していたリトライ最大回数を超えてバトル処理が止まってしまうことがありました。そのため最後の最後で使用を断念しました。

claude-sonnet-4-5

　筆者が試用する限り claude-sonnet-4-5 は性能十分です。
　思考トークンの使用は任意で、『キャラAIバトルロイヤル』においては、思考トークンを使用しないモードで試用しました。それでも回答の妥当性、JSONフォーマットの正確性など、十分な性能でした。
　JSONの回答フォーマットが合っていないことがまれにありますが、リトライで対応可能な範囲です。

『キャラAIバトルロイヤル』の使用AIモデルと理由

　前記の通りの試用の結果、『キャラAIバトルロイヤル』では、メインとなるテキスト処理に claude-sonnet-4-5 を採用しました。
　思考トークン無しで性能が十分で、費用対効果のバランスが良いと判断しています。
　より安価な gpt-4o-mini と claude-haiku-4-5 もほぼ問題ないのですが、回答に不備があるケースが少なくなかったので断念しています。
　gemini-2.5-flash および、より高性能のAIモデルは、思考トークンが必要な状況を避けたかったので、断念しました。

画像生成モデル料金比較

モデル名

/1枚

gpt-image-1

$0.167

gpt-image-1-mini

$0.036

gemini-3-pro-image-preview

$0.134

　画像生成モデルについても、料金を比較します。
　「/1枚」は、1024x1024の高品質画像の生成にかかる出力の値段です。
　これとは別に入力トークンや思考トークンにかかる金額がありますが、出力に比べれば小さいです。
　それぞれの性能については、後日別記事で詳細に解説します。

[PR]

まとめ

　本記事では、API 経由で使用する際の各社AIモデルについて解説しました。
　また、『キャラAIバトルロイヤル』で採用した、テキスト処理用AIモデルが claude-sonnet-4-5 であること、費用対効果がその理由であることを解説しました。
　なお、本ゲームでの採用は見送りましたが、普段使いであれば gpt-4o-mini の性能で十分だと感じました。とても安価ですので、別の処理でAI利用を考えている方は、試す価値があると思います。
　皆さまが、API経由でAIを使用するときの参考になりましたら幸いです。なお表は古くなっている可能性がありますので、重要な決定前にはご自身でご確認くださいますよう、お願いいたします。

補足

※各社の登録商標または商標について「®」「™」等の表記はしておりません。
記事の校正/添削に生成AIの Anthropic Claude を利用しております。
画像内のラスタライズ文字フォントにOpen Font LicenseのNoto Sans Japaneseを使用しております。

カテゴリー：プログラミング解説,キャラAIバトルロイヤル

[PR]

【技術解説】実践検証：API用 AIモデル 比較【キャラAIバトルロイヤル】

プログラミングブログ記事一覧

API利用時の AIモデル (AI Model) 選定のポイント

【料金表】API用 AIモデル比較・思考トークン一覧(GPT/Gemini/Claude)

出力トークンとは

AI利用料金の計算方法

思考トークンとは

gemini-2.5-flashの補足

入力トークンとは

各社 AIモデル の特徴と実践検証結果

ChatGPT

gpt-4o-mini

Gemini

gemini-2.5-flash

gemini-2.5-flash-lite

Claude

claude-haiku-4-5

claude-sonnet-4-5

『キャラAIバトルロイヤル』の使用AIモデルと理由

画像生成モデル料金比較

まとめ

補足

【技術解説】実践検証：API用 AIモデル比較【キャラAIバトルロイヤル】

各社 AIモデルの特徴と実践検証結果