AOYAMA Koji's プログラミングブログ - プログラミングを楽しく体験

【技術解説】実践検証:API用 AIモデル 比較【キャラAIバトルロイヤル】プログラマー向け実装解説

2026/01/26
【技術解説】実践検証:API用 AIモデル 比較【キャラAIバトルロイヤル】

 API経由で利用可能な各社AIモデル比較 (AI Model Comparison) の解説記事です。 ChatGPT(GPT-5)、Gemini、Claude等の料金・性能・思考トークンの違いを検証し、 『キャラAIバトルロイヤル』開発において最適な AIモデル を選定した理由をレポートします 。

 本ゲーム実装は『キャラAIバトルロイヤル』実装概要に記載していますので、併せてご参照ください。

【技術解説】実践検証:API用 AIモデル 比較【キャラAIバトルロイヤル】 キャラAIバトルロイヤル  ゲーム本体は『キャラAIバトルロイヤル』でプレイ可能ですので、 ぜひ新ジャンル「AI判定ゲーム」を体験してみてください。


【技術解説】実践検証:API用 AIモデル 比較【キャラAIバトルロイヤル】

プログラミングブログ記事一覧


[PR]

API利用時の AIモデル (AI Model) 選定のポイント


 プログラムからAPI経由でAIを呼び出す場合、用途に合わせた AIモデル の指定が必要です。 モデルごとに性能や料金、思考プロセスの有無が異なるため、以下の表で比較、解説します 。

【料金表】API用 AIモデル比較・思考トークン一覧(GPT/Gemini/Claude)


モデル名
/出力MTok
思考Tok
gpt-5-pro
$120
必須
gpt-5
$10
必須
gpt-5-mini
$2
必須
gpt-5-nano
$0.4
必須
gpt-4o
$10
-
gpt-4o-mini
$0.6
-
gemini-3-pro-preview
$12
必須
gemini-2.5-pro
$10
必須
gemini-2.5-flash
$2.5
必須
gemini-2.5-flash-lite
$0.4
-
claude-opus-4-5
$25
任意
claude-sonnet-4-5
$15
任意
claude-haiku-4-5
$5
任意
claude-opus-4
$75
-
claude-sonnet-4
$15
-
claude-haiku-3-5
$4
-
 この表は、筆者が詳細に調査した2025年12月時点での主要なAIモデル比較です。 モデルごとに、料金と思考トークンに関して一覧しています。
 以下で各用語を解説します。 各社AIモデルの性能詳細は後述します。

出力トークンとは


 出力MTokは、M(100万)の出力Tok(出力トークン)です。 これはAIの回答に含まれるトークンです。
 トークンとは、テキスト文章を意味のような単位に分解したものです。 日本語1文字あたり1~3トークンです。 単純に書けば、日本語1000文字で500トークン程度です。
 ただし、各モデルでトークン分解方法が異なり、まったく同じ文章でもトークン数は異なります。 筆者が試用した範囲ですと、新しいモデルほどトークン数が少なくなる傾向にあります。
 表の「/出力MTok」は「100万出力トークンあたり」を意味します。

AI利用料金の計算方法


 ここで、例えばAIの回答が 1000出力トークンだったとします。 これは100万トークンの \( \frac{1}{1000} \) です。
 表の gpt-5-pro を見ると $120 とありますので、その \( \frac{1}{1000} \) は $0.12 です。 $1≒150円とすると、約18円程度。
 つまりその回答を得るのに約18円かかります。
 gpt-4o-mini なら $0.6 の \( \frac{1}{1000} \) つまり $0.0006(約0.09円)なので、かなり安価です。

思考トークンとは


 思考Tok(思考トークン)は、内部で思考するために必要なトークンです。
 表に「必須」と書かれているモデルは思考トークンが必要です。 基本的に出力トークン料金が、思考トークンの量に応じて追加で必要です。
 「-」は、そのモデルでは思考トークンを使用しないことを表します。 つまり思考が深い処理でも、出力量を最小限にすれば、料金を抑制できます。
 「任意」とは、思考トークンを使用するかどうかをオプションで選べることを表します。 デフォルトでは使用せず、オプションで指定すると深く思考するようになり、料金と時間もかかるようになります。
 つまり gpt-5 と gpt-4o は同じ $10 に見えますが、 gpt-5 は思考トークンが必須、gpt-4o は使用しないため、 gpt-5 の方が高額になります。
 実際にどのくらい思考トークンが必要なのか不明なため、料金が青天井に見えます。 筆者が確認した範囲では、入力1000トークンに対し、同等以上の思考トークンが消費される傾向にあります。 AIモデル比較においては、この「隠れたコスト」の考慮も重要です。

gemini-2.5-flashの補足

 チャットのGeminiからは、gemini-2.5-flash は思考トークンをデフォルトでは使用せず、上限数が設定できると聞きました。 つまりこの表で「任意」のハズです。 しかし実際に試したところ、デフォルトで思考トークンを使用し、抑制できませんでした。そのため思考トークン「必須」としています。
 おそらく以前は任意だったものと思われます。状況は日々変化している可能性があります。

入力トークンとは


 入力トークンは、プロンプトつまりAIへの指示テキストに基づきます。
 入力トークンにもお金がかかりますが、出力トークンの1割程度なので、料金視点で重要なのは出力トークンと思考トークンです。

各社 AIモデル の特徴と実践検証結果


 各社AIモデルの技術的な位置付けと、筆者による実践検証の結果を解説します。
 ここでの検証は、単なる機能テストや「動かしてみた」レベルのものではありません。 『キャラAIバトルロイヤル』を実際に運用・商用提供するという前提の下、 「商業ベースで耐えうるコストパフォーマンスと精度」というシビアな基準で、 徹底的な選定を行ったものです。
 なお、本記事で言及していないAIモデルについては、スペック上の料金メリットが薄い等の理由から、今回の採用・検証候補からは外しています。

ChatGPT


モデル名
概要
gpt-5-pro
現世代・高性能版
gpt-5
現現世代・メイン
gpt-5-mini
現世代・軽量版
gpt-5-nano
現世代・超軽量版
gpt-4o
前世代・メイン
gpt-4o-mini
前世代・軽量版
 OpenAI ChatGPT の代表的なAIモデルです。

gpt-4o-mini

 筆者が試用する限り gpt-4o-mini は性能十分で、費用対効果が高く、魅力的です。
 ただし『キャラAIバトルロイヤル』において何度も試用したところ、全員が自分の必殺技にやられて敗退するなど、不適切な回答になる場合があり、使用を断念しました。

Gemini


モデル名
概要
gemini-3-pro-preview
最新世代
gemini-2.5-pro
前新世代・メイン
gemini-2.5-flash
前新世代・軽量版
gemini-2.5-flash-lite
前新世代・超軽量版
 Google Gemini の代表的なAIモデルです。

gemini-2.5-flash

 筆者が試用する限り、gemini-2.5-flash は性能十分です。
 『キャラAIバトルロイヤル』の試用でも特に大きな問題はありませんでした。 ただし思考トークンが必要なことが、試用回数を重ねた後に発覚し、採用を断念しています。

gemini-2.5-flash-lite

 gemini-2.5-flash-liteは、 例えば『キャラAIバトルロイヤル』の不適切キャラの除外シーケンス(後日プロンプト公開予定)で内容に関係なく全キャラ除外してしまうなど、 指示の意図から外れた回答になることが多く、使用を断念しました。

Claude


モデル名
概要
claude-opus-4-5
現世代・高性能版
claude-sonnet-4-5
現世代・メイン
claude-haiku-4-5
現世代・軽量版
claude-opus-4
前世代・高性能版
claude-sonnet-4
前世代・メイン
claude-haiku-3-5
前世代・軽量版
 Anthropic Claude の代表的なAIモデルです。

claude-haiku-4-5

 筆者が試用する限り claude-haiku-4-5 で性能十分です。
 ただし『キャラAIバトルロイヤル』において何度も試用すると、JSONの {} の数が合わないことがありました。 さらに、リトライしてもその状態が連続してしまい、 指定していたリトライ最大回数を超えてバトル処理が止まってしまうことがありました。 そのため最後の最後で使用を断念しました。

claude-sonnet-4-5

 筆者が試用する限り claude-sonnet-4-5 は性能十分です。
 思考トークンの使用は任意で、 『キャラAIバトルロイヤル』においては、思考トークンを使用しないモードで試用しました。 それでも回答の妥当性、JSONフォーマットの正確性など、十分な性能でした。
 JSONの回答フォーマットが合っていないことがまれにありますが、リトライで対応可能な範囲です。

『キャラAIバトルロイヤル』の使用AIモデルと理由


 前記の通りの試用の結果、『キャラAIバトルロイヤル』では、 メインとなるテキスト処理に claude-sonnet-4-5 を採用しました。
 思考トークン無しで性能が十分で、 費用対効果のバランスが良いと判断しています。
 より安価な gpt-4o-mini と claude-haiku-4-5 もほぼ問題ないのですが、 回答に不備があるケースが少なくなかったので断念しています。
 gemini-2.5-flash および、より高性能のAIモデルは、思考トークンが必要な状況を避けたかったので、断念しました。

画像生成モデル料金比較


モデル名
/1枚
gpt-image-1
$0.167
gpt-image-1-mini
$0.036
gemini-3-pro-image-preview
$0.134
 画像生成モデルについても、料金を比較します。
 「/1枚」は、1024x1024の高品質画像の生成にかかる出力の値段です。
 これとは別に入力トークンや思考トークンにかかる金額がありますが、 出力に比べれば小さいです。
 それぞれの性能については、後日別記事で詳細に解説します。
[PR]

まとめ


 本記事では、API 経由で使用する際の各社AIモデルについて解説しました。
 また、『キャラAIバトルロイヤル』で採用した、テキスト処理用AIモデルが claude-sonnet-4-5 であること、 費用対効果がその理由であることを解説しました。
 なお、本ゲームでの採用は見送りましたが、普段使いであれば gpt-4o-mini の性能で十分だと感じました。 とても安価ですので、別の処理でAI利用を考えている方は、試す価値があると思います。
 皆さまが、API経由でAIを使用するときの参考になりましたら幸いです。 なお表は古くなっている可能性がありますので、重要な決定前にはご自身でご確認くださいますよう、お願いいたします。

補足

  • ※各社の登録商標または商標について「®」「™」等の表記はしておりません。
  • 記事の校正/添削に生成AIの Anthropic Claude を利用しております。
  • 画像内のラスタライズ文字フォントにOpen Font LicenseNoto Sans Japaneseを使用しております。

カテゴリー:プログラミング解説,キャラAIバトルロイヤル
[PR]