2026.06.30 生成AI API コスト

Claude CodeとChatGPTの利用上限を理解する

トークン・メッセージ・コンテキスト・レート制限の関係と、Claude Sonnet 4.6・GPT-5.4 のサブスクリプション/API 費用を整理した記録です。

調査日:2026年6月30日。料金・モデル・利用上限は変更される可能性があります。更新時には末尾の公式情報を再確認してください。

本記事を含む RESEARCH セクションの共通前提(Craft ERP プロジェクト)は Craft ERP Overview にまとめています。

1. 調査の目的

Claude CodeやChatGPTを利用していると、次のような言葉が頻繁に登場します。

  • トークン
  • メッセージ
  • コンテキスト
  • コンテキストウィンドウ
  • 利用上限
  • レート制限

これらは似た意味に見えますが、実際には別の概念です。特に注意が必要なのは、サブスクリプションの上限とAPIの上限を、単純にトークン数だけで比較できないことです。

本稿では、用語の関係を整理したうえで、個人開発で実用的なモデルとして次の組み合わせを比較します。

サービス比較対象
AnthropicClaude Pro/Claude Code、Claude Sonnet 4.6 API
OpenAIChatGPT Plus/Codex、GPT-5.4 API

2. 先に結論

結論を先に整理すると、次のとおりです。

  1. トークンは、AIが文章やコードを処理する量の単位です。
  2. メッセージは、ユーザーまたはAIが送信した1回分のまとまりです。
  3. コンテキストは、AIが今回の処理で参照する情報全体です。
  4. コンテキストウィンドウは、一度の処理で参照できる情報量の上限です。
  5. レート制限は、一定時間内に送信できるリクエスト数やトークン量の上限です。
  6. サブスクリプションでは、利用可能な総トークン数は原則として公開されていません
  7. APIでは、入力・キャッシュ入力・出力トークン数が計測され、従量課金されます。
  8. そのため、サブスクリプションとAPIの比較は、厳密な等価比較ではなく、月額固定費と仮定したAPI使用量の比較になります。

3. 用語の関係

全体の関係は、次のように整理できます。

トークン
  └─ 文章やコードをAIが処理する最小単位
       ↓ 集まる
メッセージ
  └─ ユーザーまたはAIが送信する1回分の内容
       ↓ 履歴・ファイル・指示などと一緒にまとめられる
コンテキスト
  └─ AIが今回の回答で参照する情報全体
       ↓ 上限がある
コンテキストウィンドウ
  └─ 一度の処理で扱える最大容量

一定時間内の利用量には、別途レート制限・利用上限が適用される

3.1 トークン

トークンは、AIが文章やコードを処理するための単位です。文字数や単語数と似ていますが、同じではありません。日本語の1文字が必ず1トークンになるわけではなく、英単語も複数トークンに分割される場合があります。同じ文章でもモデルのトークナイザーが異なれば、トークン数が変わることがあります。

API料金では、主に次のトークンが課金対象になります。

種類内容
入力トークン指示、会話履歴、コード、ファイル内容、ツール結果など
キャッシュ入力トークン過去に送った同一・共通部分をキャッシュから再利用した入力
出力トークンAIが生成した回答、コード、推論用トークンなど

OpenAIの推論モデルでは、利用者にそのまま表示されない推論トークンも出力トークンとして扱われ、コンテキストと料金に影響します。[13]

3.2 メッセージ

メッセージは、ユーザーまたはAIが送信する1回分のまとまりです。次の2つは、どちらも「1メッセージ」です。

この関数を修正してください。
以下の仕様書と5,000行のコードを確認し、
設計上の問題、修正案、テストコードを提示してください。
……

しかし、含まれるトークン量は大きく異なります。

内容メッセージ数トークン量
短い質問1少ない
長い仕様書を貼り付ける1多い
大量のコードやログを含める1非常に多い

したがって、1メッセージ=一定数のトークンではありません。

3.3 コンテキスト

コンテキストは、AIが今回の回答を生成するために参照する情報全体です。Claude CodeやCodexのようなコーディングエージェントでは、次の内容がコンテキストに含まれます。

  • システム指示
  • ユーザーの今回の依頼
  • 過去のメッセージ
  • AIの過去の回答
  • CLAUDE.mdAGENTS.md
  • 読み込んだソースコード
  • Gitの差分
  • テスト結果
  • ビルドログやエラーログ
  • Web検索、MCP、ツール実行の結果

Anthropicは、Claude Codeの各ターンで「それまでの会話」「プロジェクトのコンテキスト」「新しいプロンプト」がモデルへ送られると説明しています。[3]

3.4 コンテキストウィンドウ

コンテキストウィンドウは、モデルが一度の処理で扱える情報量の上限です。机に例えると、次のようになります。

用語例え
トークン紙に書かれた文字や単語の断片
メッセージ1枚の依頼書や回答書
コンテキスト現在、机の上に広げられている全資料
コンテキストウィンドウ机の広さ
利用上限一定期間に作業を依頼できる総量
API料金読ませた量と書かせた量に応じた料金

コンテキストウィンドウが100万トークンであっても、月間100万トークンしか使えないという意味ではありません。これは、一度の処理で最大どれだけの情報を扱えるかを示す値です。

3.5 レート制限

レート制限は、短時間に大量の処理が集中しないように設けられる上限です。APIでは、主に次の単位が使われます。

略称意味
RPMRequests Per Minute:1分当たりのリクエスト数
TPMTokens Per Minute:1分当たりのトークン数
ITPMInput Tokens Per Minute:1分当たりの入力トークン数
OTPMOutput Tokens Per Minute:1分当たりの出力トークン数

Anthropic APIでは、RPM・ITPM・OTPMがモデルクラスごとに設定されています。OpenAI APIも、利用階層に応じてリクエスト数やトークン量の上限が設定されます。[6] [12]

レート制限は、月間予算とは別です。なお、サブスクリプションで使われる「5時間枠」「週間枠」「メッセージ上限」は、厳密にはAPIのRPM・TPMとは異なる利用上限です。本稿では混同を避けるため、サブスクリプションは利用上限、APIの短時間制御はレート制限と呼び分けます。

月間予算に余裕があっても、
1分間に大量のリクエストを送ればレート制限に到達することがある。

4. トークン・メッセージ・コンテキストの具体例

以下の数値は、関係を理解するための概念例です。実際のトークン数は、モデル、指示、ファイル形式、ツール利用などによって変わります。

4.1 1回目のメッセージ

ユーザーが、2,000トークン相当のコードと短い依頼を送ったとします。

コンテキストの内容仮のトークン数
システム・ツールの指示1,000
ユーザーの依頼100
ソースコード2,000
合計入力3,100
AIの回答500

この処理では、おおむね入力3,100トークンと出力500トークンが発生します。

4.2 2回目のメッセージ

続けて、ユーザーが「別の方法で修正してください。」と依頼します。この文章自体は短くても、AIは前回の会話やコードを参照します。

コンテキストの内容仮のトークン数
システム・ツールの指示1,000
前回の依頼とコード2,100
前回のAI回答500
今回の依頼20
合計入力3,620
今回のAI回答600

つまり、画面上は短い1メッセージでも、実際には過去のコンテキストを含めて数千・数万トークンが処理されることがあります。

4.3 会話が長くなると入力が増える

単純化すると、次のように増えていきます。

1回目:入力 3,100トークン
2回目:入力 3,620トークン
3回目:入力 4,220トークン
4回目:入力 5,000トークン
……

コーディングエージェントで利用上限を早く消費する主な原因は、メッセージ数そのものよりも、各ターンで再利用される履歴・ファイル・ツール結果が大きくなることです。

5. サブスクリプションの利用上限

5.1 Claude Pro/Claude Code

Claude Proは月額20ドルです。利用上限は固定トークン数ではなく、セッション単位・週間単位で管理されます。[1]

項目内容
月額20ドル
セッション上限5時間単位でリセット
週間上限あり
総トークン上限非公開
利用枠の共有Claude、Claude Desktop、Claude Codeで共有
消費量に影響する要素会話長、ファイル、モデル、機能、思考量、処理の複雑さ

Anthropicは、利用上限を「一定期間にClaudeとやり取りできる会話予算」と説明しています。一方、コンテキストウィンドウは「1つの会話で扱える長さの上限」です。[2]

5.2 ChatGPT Plus/Codex

ChatGPT Plusは米国の公式価格で月額20ドルで、API利用料は含まれません。実際の請求額は、税、地域通貨、アプリストア経由の購入などによって異なる場合があります。[8]

CodexをChatGPT Plusで利用する場合、GPT-5.4のローカルメッセージ数は、公式の目安として5時間当たり20~100回です。追加の週間上限が適用される場合があります。[9]

項目内容
月額20ドル
Codex GPT-5.4の目安5時間当たり20~100ローカルメッセージ
週間上限追加適用される場合あり
総トークン上限非公開
消費量に影響する要素モデル、コード量、タスクの複雑さ、保持するコンテキスト、実行時間

同じ1メッセージでも、小さな関数修正と大規模コードベースの解析では、利用枠の消費量が異なります。なお、ここで示す20~100回はCodexでGPT-5.4を使う場合の目安であり、通常のChatGPTチャットのメッセージ上限とは別です。

5.3 サブスクリプション同士の比較

比較項目Claude Pro+Claude CodeChatGPT Plus+Codex
月額20ドル20ドル
制限の基本単位5時間枠+週間枠5時間枠+週間枠の場合あり
固定トークン総量非公開非公開
公開される利用目安メッセージ数は利用内容により変動GPT-5.4は20~100ローカルメッセージ/5時間
上限到達後リセット待ち、またはUsage Creditsリセット待ち、追加クレジット、APIキー利用
API料金別料金別料金

重要なのは、サブスクリプションの20ドルを、APIの何トークン分と正確に換算することはできない点です。

6. APIの料金とモデル比較

本稿では、日常的な開発作業で実用的な比較対象として、Claude Sonnet 4.6とGPT-5.4を使用します。

6.1 モデル仕様と標準料金

単価は100万トークン当たりです。

項目Claude Sonnet 4.6GPT-5.4
標準入力3.00ドル2.50ドル
キャッシュ入力0.30ドル0.25ドル
出力15.00ドル15.00ドル
コンテキストウィンドウ100万トークン105万トークン
最大出力128,000トークン128,000トークン
主な位置付け速度と知能のバランスコーディング・専門業務向けの比較的低価格なモデル

AnthropicはSonnet 4.6を入力3ドル・出力15ドル/100万トークン、100万トークンのコンテキストとして公開しています。[4] [5]

OpenAIはGPT-5.4を入力2.50ドル・キャッシュ入力0.25ドル・出力15ドル/100万トークン、105万トークンのコンテキストとして公開しています。[10] [11]

6.2 GPT-5.4の長文料金

GPT-5.4では、1回のリクエストの入力が272Kトークンを超える場合、そのセッション全体に次の料金が適用されます。[10]

項目通常料金272K超の長文料金
入力2.50ドル/100万5.00ドル/100万
キャッシュ入力0.25ドル/100万0.50ドル/100万
出力15.00ドル/100万22.50ドル/100万

一方、Claude Sonnet 4.6の100万トークンコンテキストは、2026年3月から標準料金で一般提供されています。[7]

この違いにより、月間合計ではGPT-5.4の方が安くても、1回で巨大なコンテキストを処理する場合はSonnet 4.6の方が安くなることがあります

7. API費用の試算

7.1 試算条件

  • 入力:出力=5:1
  • 標準API料金
  • 各リクエストのGPT-5.4入力は272K以下
  • キャッシュは使用しない
  • Web検索、Code Interpreter、コンテナなどのツール料金は含めない
  • ClaudeとOpenAIで同じトークン量を使うと仮定

これは比較用のモデルケースであり、実際の利用量を保証するものではありません。

7.2 各APIの月間費用

月間利用量Claude Sonnet 4.6GPT-5.4
入力100万+出力20万6.00ドル5.50ドル
入力300万+出力60万18.00ドル16.50ドル
入力500万+出力100万30.00ドル27.50ドル
入力1,000万+出力200万60.00ドル55.00ドル

計算例は次のとおりです。

Claude Sonnet 4.6
入力100万 × 3.00ドル = 3.00ドル
出力20万 × 15.00ドル = 3.00ドル
合計                  = 6.00ドル

GPT-5.4
入力100万 × 2.50ドル = 2.50ドル
出力20万 × 15.00ドル = 3.00ドル
合計                  = 5.50ドル

7.3 現在の2契約とAPI合計の比較

Claude ProとChatGPT Plusを両方契約する場合、固定費は月40ドルです。

各APIでの月間利用量Sonnet 4.6GPT-5.4API合計サブスク合計
入力100万+出力20万6.00ドル5.50ドル11.50ドル40ドル
入力300万+出力60万18.00ドル16.50ドル34.50ドル40ドル
入力500万+出力100万30.00ドル27.50ドル57.50ドル40ドル
入力1,000万+出力200万60.00ドル55.00ドル115.00ドル40ドル

同じトークン量を両APIで使う前提では、各APIが入力約348万+出力約70万トークンに達すると、API合計が約40ドルになります。ただし、これはサブスクリプションが同じトークン量を提供するという意味ではありません。サブスクリプション側の総トークン枠が公開されていないため、比較できるのは固定費とAPI費用だけです。

7.4 1契約20ドルとの損益分岐点

入力:出力=5:1の場合、API費用が20ドルに達する目安は次のとおりです。

モデル入力出力合計トークン
Claude Sonnet 4.6約333万約67万約400万
GPT-5.4約364万約73万約436万

これも、サブスクリプションの利用枠と等価であることを示すものではありません。

8. 具体的なAPI料金例

8.1 小さな設計相談

入力10,000トークン、出力2,000トークンの場合です。

モデル入力料金出力料金合計
Claude Sonnet 4.60.030ドル0.030ドル0.060ドル
GPT-5.40.025ドル0.030ドル0.055ドル

8.2 中規模のコードレビュー

入力100,000トークン、出力20,000トークンの場合です。

モデル入力料金出力料金合計
Claude Sonnet 4.60.30ドル0.30ドル0.60ドル
GPT-5.40.25ドル0.30ドル0.55ドル

この処理を月100回実行すると、単純計算ではSonnet 4.6が60ドル、GPT-5.4が55ドルです。

8.3 1回の巨大なコードベース解析

入力500,000トークン、出力50,000トークンの場合です。

モデル適用料金入力料金出力料金合計
Claude Sonnet 4.6標準料金1.50ドル0.75ドル2.25ドル
GPT-5.4272K超の長文料金2.50ドル1.125ドル3.625ドル

月間の総入力が500,000トークンであっても、複数の小さなリクエストに分かれていればGPT-5.4の長文料金は適用されません。重要なのは、月間合計ではなく、1回の入力サイズです。

9. キャッシュによる料金削減

コーディング用途では、システム指示、リポジトリの規約、共通コード、長い会話履歴など、同じ入力が繰り返し使われます。プロンプトキャッシュが適用されると、共通部分の入力単価は大きく下がります。

例として、月間入力500万トークンのうち80%がキャッシュ入力、出力100万トークンとします。

モデルキャッシュなし80%キャッシュ時
Claude Sonnet 4.630.00ドル19.20ドル
GPT-5.427.50ドル18.50ドル

計算には、通常入力100万、キャッシュ入力400万、出力100万を使用しています。ただし、キャッシュが必ず80%適用されるわけではありません。プロンプト構造、会話状態、キャッシュ保持時間、ツール利用などによって変わります。

10. 使用量を確認する方法

利用形態確認方法確認できる内容
Claude ProSettings > Usage5時間枠・週間枠の消費状況とリセット時刻
Claude Code/context現在のコンテキスト使用状況
CodexCodex usage dashboard現在の利用枠
Codex CLI/statusセッション中の残り利用枠
Claude APIClaude Console、APIレスポンス入力、キャッシュ、出力トークン、費用
OpenAI APIUsage Dashboard、APIレスポンスのusage入力、キャッシュ、出力、推論、合計トークン

OpenAIのResponses APIでは、レスポンスのusageに入力・キャッシュ入力・出力・推論・合計トークンが含まれます。また、送信前に入力トークン数を取得するエンドポイントもあります。[14]

Anthropicには、メッセージを生成せずに入力トークン数を確認するToken Counting APIがあります。[15]

通常のChatGPTやClaudeのサブスクリプション画面では、APIのような正確な累計入力・出力トークン数は確認できません。

11. 利用枠と費用を抑える実践方法

11.1 タスクが変わったら会話を分ける

無関係な作業を同じセッションで続けると、過去の履歴が毎回コンテキストへ含まれます。Claude Codeでは、タスクが切り替わるときに/clear、長い作業を継続するときに/compactを使う方法が公式に案内されています。[3]

11.2 大きなファイルを無条件に貼り付けない

ファイル全体を貼り付けると、その内容が以後のコンテキストに残り続けます。次のように、対象を絞った指示の方が効率的です。

悪い例:このリポジトリ全体を確認してください。

良い例:src/auth/validate_token.py の validate_token 関数と、
関連するテストだけを確認してください。

11.3 CLAUDE.mdAGENTS.mdを肥大化させない

これらのファイルは、各ターンでコンテキストへ追加される場合があります。永続的に必要な規約だけを残し、個別Issueの仕様や一時的な調査結果を詰め込みすぎないことが重要です。

11.4 出力を必要以上に長くしない

両モデルとも、出力単価は入力単価より高く設定されています。

モデル入力単価出力単価出力/入力の倍率
Claude Sonnet 4.63.00ドル15.00ドル5倍
GPT-5.42.50ドル15.00ドル6倍

APIでは、「説明は不要」「差分だけ」「最大500文字」など、必要な出力を明示すると費用を抑えやすくなります。

11.5 自動化はAPI、対話作業はサブスクリプションを基本にする

用途適した方式
日常的な設計相談、調査、実装サブスクリプション
CI/CD、定期バッチ、複数ユーザー向け機能API
利用上限到達後の追加作業追加クレジットまたはAPI
月に数回だけの小規模処理APIのみも選択肢
大規模リポジトリを継続的に扱うサブスクリプションを基本に実績計測

12. サブスクリプションとAPIの選び方

12.1 サブスクリプションが向くケース

  • 毎日、対話しながら設計や実装を進める
  • 利用量を細かく気にせず作業したい
  • Web検索、ファイル分析、Codexのクラウド機能なども使う
  • 月額費用を固定したい
  • APIキーや課金監視を管理したくない

12.2 APIが向くケース

  • CI/CDやバッチ処理に組み込む
  • アプリケーションから自動実行する
  • 使用量と費用を正確に記録したい
  • 月によって利用量が大きく変わる
  • キャッシュやモデル切り替えでコストを最適化したい

12.3 実用的な組み合わせ

個人開発では、次の構成が現実的です。

Claude Pro+ChatGPT Plus
  ├─ 人が対話しながら行う設計・実装・レビュー
  └─ 月額固定費:合計40ドル

Claude Sonnet 4.6 API+GPT-5.4 API
  ├─ CI/CD、定期処理、評価、ログ解析、自動レビュー
  └─ 使用したトークン分だけ従量課金

サブスクリプションをすべてAPIへ置き換えるのではなく、対話型作業はサブスクリプション、自動化はAPIと役割を分ける方が、費用と使い勝手のバランスを取りやすくなります。

13. 注意点

13.1 サブスクの損益分岐点は確定できない

サブスクリプションに含まれる総トークン量が公開されていないため、「Claude Proの20ドルはAPIの400万トークン分」「ChatGPT Plusの20ドルはAPIの436万トークン分」といった断定はできません。400万・436万トークンという数値は、API料金が20ドルになる地点であり、サブスクリプションの実容量ではありません。

13.2 コンテキスト上限と利用上限は別

100万トークンのコンテキストウィンドウがあっても、100万トークンの処理を何度でも無制限に実行できるわけではありません。

  • コンテキスト上限:1回の処理容量
  • 利用上限:一定時間・週間などの総利用量
  • レート制限:短時間に処理できる速度
  • 課金上限:APIで支払える金額

これらは別々に管理されます。

13.3 ツール料金を忘れない

APIでは、モデルのトークン料金以外に、Web検索、File Search、Code Interpreter/Hosted Shell、コンテナ、画像生成、データ保存、地域指定処理などの費用が発生する場合があります。大量に自動化する場合は、トークン料金だけでなく、ツール呼び出し回数も計測する必要があります。

13.4 モデルと料金は変わる

生成AIのモデル、料金、コンテキスト、サブスクリプション上限は頻繁に更新されます。公開記事には調査日を明記し、料金表を固定的な事実として長期間放置しない運用が必要です。

14. まとめ

用語意味
トークンAIが処理する文章・コード量の単位
メッセージユーザーまたはAIが送信する1回分のまとまり
コンテキスト今回の処理でAIが参照する情報全体
コンテキストウィンドウ一度に扱えるコンテキストの最大容量
利用上限一定期間にサービスを利用できる総量
レート制限一定時間内に処理できるリクエスト・トークン量

サブスクリプションでは、総トークン上限が公開されていないため、APIとの厳密な費用比較はできません。一方、APIはトークン数と費用を正確に記録でき、自動化や継続的な処理に向いています。個人開発における現実的な考え方は、次のとおりです。

人が対話しながら進める作業はサブスクリプション、定期実行・CI/CD・アプリ組み込みはAPIを使う。

そのうえで、APIのUsage Dashboardを1か月程度記録し、実際の入力・キャッシュ・出力トークン量から契約構成を判断するのが最も確実です。

公式情報・参照元

  1. Anthropic, What is the Pro plan? — support.claude.com
  2. Anthropic, How do usage and length limits work? — support.claude.com
  3. Anthropic, Models, usage, and limits in Claude Code — support.claude.com
  4. Anthropic, Models overview — platform.claude.com
  5. Anthropic, Pricing — platform.claude.com
  6. Anthropic, Rate limits — platform.claude.com
  7. Anthropic, Claude Platform release notes — platform.claude.com
  8. OpenAI, What is ChatGPT Plus? — help.openai.com
  9. OpenAI, Codex Pricing — developers.openai.com
  10. OpenAI, GPT-5.4 Model — developers.openai.com
  11. OpenAI, API Pricing — developers.openai.com
  12. OpenAI, GPT-5.4 Rate limits — developers.openai.com
  13. OpenAI, Reasoning models — platform.openai.com
  14. OpenAI, Responses API reference — platform.openai.com
  15. Anthropic, Token counting — platform.claude.com

Related Service

この整理は、生成AI × 仕様駆動開発で進めている Craft ERP の開発で、AI 利用コストをどう設計するかの検討記録です。