2026.06.30 生成AI API コスト

Claude CodeとChatGPTの利用上限を理解する

トークン・メッセージ・コンテキスト・レート制限の関係と、Claude Sonnet 4.6・GPT-5.4 のサブスクリプション／API 費用を整理した記録です。

調査日：2026年6月30日。料金・モデル・利用上限は変更される可能性があります。更新時には末尾の公式情報を再確認してください。

本記事を含む RESEARCH セクションの共通前提（Craft ERP プロジェクト）は Craft ERP Overview にまとめています。

1. 調査の目的

Claude CodeやChatGPTを利用していると、次のような言葉が頻繁に登場します。

トークン
メッセージ
コンテキスト
コンテキストウィンドウ
利用上限
レート制限

これらは似た意味に見えますが、実際には別の概念です。特に注意が必要なのは、サブスクリプションの上限とAPIの上限を、単純にトークン数だけで比較できないことです。

本稿では、用語の関係を整理したうえで、個人開発で実用的なモデルとして次の組み合わせを比較します。

サービス	比較対象
Anthropic	Claude Pro／Claude Code、Claude Sonnet 4.6 API
OpenAI	ChatGPT Plus／Codex、GPT-5.4 API

2. 先に結論

結論を先に整理すると、次のとおりです。

トークンは、AIが文章やコードを処理する量の単位です。
メッセージは、ユーザーまたはAIが送信した1回分のまとまりです。
コンテキストは、AIが今回の処理で参照する情報全体です。
コンテキストウィンドウは、一度の処理で参照できる情報量の上限です。
レート制限は、一定時間内に送信できるリクエスト数やトークン量の上限です。
サブスクリプションでは、利用可能な総トークン数は原則として公開されていません。
APIでは、入力・キャッシュ入力・出力トークン数が計測され、従量課金されます。
そのため、サブスクリプションとAPIの比較は、厳密な等価比較ではなく、月額固定費と仮定したAPI使用量の比較になります。

3. 用語の関係

全体の関係は、次のように整理できます。

トークン
  └─ 文章やコードをAIが処理する最小単位
       ↓ 集まる
メッセージ
  └─ ユーザーまたはAIが送信する1回分の内容
       ↓ 履歴・ファイル・指示などと一緒にまとめられる
コンテキスト
  └─ AIが今回の回答で参照する情報全体
       ↓ 上限がある
コンテキストウィンドウ
  └─ 一度の処理で扱える最大容量

一定時間内の利用量には、別途レート制限・利用上限が適用される

3.1 トークン

トークンは、AIが文章やコードを処理するための単位です。文字数や単語数と似ていますが、同じではありません。日本語の1文字が必ず1トークンになるわけではなく、英単語も複数トークンに分割される場合があります。同じ文章でもモデルのトークナイザーが異なれば、トークン数が変わることがあります。

API料金では、主に次のトークンが課金対象になります。

種類	内容
入力トークン	指示、会話履歴、コード、ファイル内容、ツール結果など
キャッシュ入力トークン	過去に送った同一・共通部分をキャッシュから再利用した入力
出力トークン	AIが生成した回答、コード、推論用トークンなど

OpenAIの推論モデルでは、利用者にそのまま表示されない推論トークンも出力トークンとして扱われ、コンテキストと料金に影響します。^[13]

3.2 メッセージ

メッセージは、ユーザーまたはAIが送信する1回分のまとまりです。次の2つは、どちらも「1メッセージ」です。

この関数を修正してください。

以下の仕様書と5,000行のコードを確認し、
設計上の問題、修正案、テストコードを提示してください。
……

しかし、含まれるトークン量は大きく異なります。

内容	メッセージ数	トークン量
短い質問	1	少ない
長い仕様書を貼り付ける	1	多い
大量のコードやログを含める	1	非常に多い

したがって、1メッセージ＝一定数のトークンではありません。

3.3 コンテキスト

コンテキストは、AIが今回の回答を生成するために参照する情報全体です。Claude CodeやCodexのようなコーディングエージェントでは、次の内容がコンテキストに含まれます。

システム指示
ユーザーの今回の依頼
過去のメッセージ
AIの過去の回答
CLAUDE.mdやAGENTS.md
読み込んだソースコード
Gitの差分
テスト結果
ビルドログやエラーログ
Web検索、MCP、ツール実行の結果

Anthropicは、Claude Codeの各ターンで「それまでの会話」「プロジェクトのコンテキスト」「新しいプロンプト」がモデルへ送られると説明しています。^[3]

3.4 コンテキストウィンドウ

コンテキストウィンドウは、モデルが一度の処理で扱える情報量の上限です。机に例えると、次のようになります。

用語	例え
トークン	紙に書かれた文字や単語の断片
メッセージ	1枚の依頼書や回答書
コンテキスト	現在、机の上に広げられている全資料
コンテキストウィンドウ	机の広さ
利用上限	一定期間に作業を依頼できる総量
API料金	読ませた量と書かせた量に応じた料金

コンテキストウィンドウが100万トークンであっても、月間100万トークンしか使えないという意味ではありません。これは、一度の処理で最大どれだけの情報を扱えるかを示す値です。

3.5 レート制限

レート制限は、短時間に大量の処理が集中しないように設けられる上限です。APIでは、主に次の単位が使われます。

略称	意味
RPM	Requests Per Minute：1分当たりのリクエスト数
TPM	Tokens Per Minute：1分当たりのトークン数
ITPM	Input Tokens Per Minute：1分当たりの入力トークン数
OTPM	Output Tokens Per Minute：1分当たりの出力トークン数

Anthropic APIでは、RPM・ITPM・OTPMがモデルクラスごとに設定されています。OpenAI APIも、利用階層に応じてリクエスト数やトークン量の上限が設定されます。^[6] ^[12]

レート制限は、月間予算とは別です。なお、サブスクリプションで使われる「5時間枠」「週間枠」「メッセージ上限」は、厳密にはAPIのRPM・TPMとは異なる利用上限です。本稿では混同を避けるため、サブスクリプションは利用上限、APIの短時間制御はレート制限と呼び分けます。

月間予算に余裕があっても、
1分間に大量のリクエストを送ればレート制限に到達することがある。

4. トークン・メッセージ・コンテキストの具体例

以下の数値は、関係を理解するための概念例です。実際のトークン数は、モデル、指示、ファイル形式、ツール利用などによって変わります。

4.1 1回目のメッセージ

ユーザーが、2,000トークン相当のコードと短い依頼を送ったとします。

コンテキストの内容	仮のトークン数
システム・ツールの指示	1,000
ユーザーの依頼	100
ソースコード	2,000
合計入力	3,100
AIの回答	500

この処理では、おおむね入力3,100トークンと出力500トークンが発生します。

4.2 2回目のメッセージ

続けて、ユーザーが「別の方法で修正してください。」と依頼します。この文章自体は短くても、AIは前回の会話やコードを参照します。

コンテキストの内容	仮のトークン数
システム・ツールの指示	1,000
前回の依頼とコード	2,100
前回のAI回答	500
今回の依頼	20
合計入力	3,620
今回のAI回答	600

つまり、画面上は短い1メッセージでも、実際には過去のコンテキストを含めて数千・数万トークンが処理されることがあります。

4.3 会話が長くなると入力が増える

単純化すると、次のように増えていきます。

1回目：入力 3,100トークン
2回目：入力 3,620トークン
3回目：入力 4,220トークン
4回目：入力 5,000トークン
……

コーディングエージェントで利用上限を早く消費する主な原因は、メッセージ数そのものよりも、各ターンで再利用される履歴・ファイル・ツール結果が大きくなることです。

5. サブスクリプションの利用上限

5.1 Claude Pro／Claude Code

Claude Proは月額20ドルです。利用上限は固定トークン数ではなく、セッション単位・週間単位で管理されます。^[1]

項目	内容
月額	20ドル
セッション上限	5時間単位でリセット
週間上限	あり
総トークン上限	非公開
利用枠の共有	Claude、Claude Desktop、Claude Codeで共有
消費量に影響する要素	会話長、ファイル、モデル、機能、思考量、処理の複雑さ

Anthropicは、利用上限を「一定期間にClaudeとやり取りできる会話予算」と説明しています。一方、コンテキストウィンドウは「1つの会話で扱える長さの上限」です。^[2]

5.2 ChatGPT Plus／Codex

ChatGPT Plusは米国の公式価格で月額20ドルで、API利用料は含まれません。実際の請求額は、税、地域通貨、アプリストア経由の購入などによって異なる場合があります。^[8]

CodexをChatGPT Plusで利用する場合、GPT-5.4のローカルメッセージ数は、公式の目安として5時間当たり20～100回です。追加の週間上限が適用される場合があります。^[9]

項目	内容
月額	20ドル
Codex GPT-5.4の目安	5時間当たり20～100ローカルメッセージ
週間上限	追加適用される場合あり
総トークン上限	非公開
消費量に影響する要素	モデル、コード量、タスクの複雑さ、保持するコンテキスト、実行時間

同じ1メッセージでも、小さな関数修正と大規模コードベースの解析では、利用枠の消費量が異なります。なお、ここで示す20～100回はCodexでGPT-5.4を使う場合の目安であり、通常のChatGPTチャットのメッセージ上限とは別です。

5.3 サブスクリプション同士の比較

比較項目	Claude Pro＋Claude Code	ChatGPT Plus＋Codex
月額	20ドル	20ドル
制限の基本単位	5時間枠＋週間枠	5時間枠＋週間枠の場合あり
固定トークン総量	非公開	非公開
公開される利用目安	メッセージ数は利用内容により変動	GPT-5.4は20～100ローカルメッセージ／5時間
上限到達後	リセット待ち、またはUsage Credits	リセット待ち、追加クレジット、APIキー利用
API料金	別料金	別料金

重要なのは、サブスクリプションの20ドルを、APIの何トークン分と正確に換算することはできない点です。

6. APIの料金とモデル比較

本稿では、日常的な開発作業で実用的な比較対象として、Claude Sonnet 4.6とGPT-5.4を使用します。

6.1 モデル仕様と標準料金

単価は100万トークン当たりです。

項目	Claude Sonnet 4.6	GPT-5.4
標準入力	3.00ドル	2.50ドル
キャッシュ入力	0.30ドル	0.25ドル
出力	15.00ドル	15.00ドル
コンテキストウィンドウ	100万トークン	105万トークン
最大出力	128,000トークン	128,000トークン
主な位置付け	速度と知能のバランス	コーディング・専門業務向けの比較的低価格なモデル

AnthropicはSonnet 4.6を入力3ドル・出力15ドル／100万トークン、100万トークンのコンテキストとして公開しています。^[4] ^[5]

OpenAIはGPT-5.4を入力2.50ドル・キャッシュ入力0.25ドル・出力15ドル／100万トークン、105万トークンのコンテキストとして公開しています。^[10] ^[11]

6.2 GPT-5.4の長文料金

GPT-5.4では、1回のリクエストの入力が272Kトークンを超える場合、そのセッション全体に次の料金が適用されます。^[10]

項目	通常料金	272K超の長文料金
入力	2.50ドル／100万	5.00ドル／100万
キャッシュ入力	0.25ドル／100万	0.50ドル／100万
出力	15.00ドル／100万	22.50ドル／100万

一方、Claude Sonnet 4.6の100万トークンコンテキストは、2026年3月から標準料金で一般提供されています。^[7]

この違いにより、月間合計ではGPT-5.4の方が安くても、1回で巨大なコンテキストを処理する場合はSonnet 4.6の方が安くなることがあります。

7. API費用の試算

7.1 試算条件

入力：出力＝5：1
標準API料金
各リクエストのGPT-5.4入力は272K以下
キャッシュは使用しない
Web検索、Code Interpreter、コンテナなどのツール料金は含めない
ClaudeとOpenAIで同じトークン量を使うと仮定

これは比較用のモデルケースであり、実際の利用量を保証するものではありません。

7.2 各APIの月間費用

月間利用量	Claude Sonnet 4.6	GPT-5.4
入力100万＋出力20万	6.00ドル	5.50ドル
入力300万＋出力60万	18.00ドル	16.50ドル
入力500万＋出力100万	30.00ドル	27.50ドル
入力1,000万＋出力200万	60.00ドル	55.00ドル

計算例は次のとおりです。

Claude Sonnet 4.6
入力100万 × 3.00ドル = 3.00ドル
出力20万 × 15.00ドル = 3.00ドル
合計                  = 6.00ドル

GPT-5.4
入力100万 × 2.50ドル = 2.50ドル
出力20万 × 15.00ドル = 3.00ドル
合計                  = 5.50ドル

7.3 現在の2契約とAPI合計の比較

Claude ProとChatGPT Plusを両方契約する場合、固定費は月40ドルです。

各APIでの月間利用量	Sonnet 4.6	GPT-5.4	API合計	サブスク合計
入力100万＋出力20万	6.00ドル	5.50ドル	11.50ドル	40ドル
入力300万＋出力60万	18.00ドル	16.50ドル	34.50ドル	40ドル
入力500万＋出力100万	30.00ドル	27.50ドル	57.50ドル	40ドル
入力1,000万＋出力200万	60.00ドル	55.00ドル	115.00ドル	40ドル

同じトークン量を両APIで使う前提では、各APIが入力約348万＋出力約70万トークンに達すると、API合計が約40ドルになります。ただし、これはサブスクリプションが同じトークン量を提供するという意味ではありません。サブスクリプション側の総トークン枠が公開されていないため、比較できるのは固定費とAPI費用だけです。

7.4 1契約20ドルとの損益分岐点

入力：出力＝5：1の場合、API費用が20ドルに達する目安は次のとおりです。

モデル	入力	出力	合計トークン
Claude Sonnet 4.6	約333万	約67万	約400万
GPT-5.4	約364万	約73万	約436万

これも、サブスクリプションの利用枠と等価であることを示すものではありません。

8. 具体的なAPI料金例

8.1 小さな設計相談

入力10,000トークン、出力2,000トークンの場合です。

モデル	入力料金	出力料金	合計
Claude Sonnet 4.6	0.030ドル	0.030ドル	0.060ドル
GPT-5.4	0.025ドル	0.030ドル	0.055ドル

8.2 中規模のコードレビュー

入力100,000トークン、出力20,000トークンの場合です。

モデル	入力料金	出力料金	合計
Claude Sonnet 4.6	0.30ドル	0.30ドル	0.60ドル
GPT-5.4	0.25ドル	0.30ドル	0.55ドル

この処理を月100回実行すると、単純計算ではSonnet 4.6が60ドル、GPT-5.4が55ドルです。

8.3 1回の巨大なコードベース解析

入力500,000トークン、出力50,000トークンの場合です。

モデル	適用料金	入力料金	出力料金	合計
Claude Sonnet 4.6	標準料金	1.50ドル	0.75ドル	2.25ドル
GPT-5.4	272K超の長文料金	2.50ドル	1.125ドル	3.625ドル

月間の総入力が500,000トークンであっても、複数の小さなリクエストに分かれていればGPT-5.4の長文料金は適用されません。重要なのは、月間合計ではなく、1回の入力サイズです。

9. キャッシュによる料金削減

コーディング用途では、システム指示、リポジトリの規約、共通コード、長い会話履歴など、同じ入力が繰り返し使われます。プロンプトキャッシュが適用されると、共通部分の入力単価は大きく下がります。

例として、月間入力500万トークンのうち80％がキャッシュ入力、出力100万トークンとします。

モデル	キャッシュなし	80％キャッシュ時
Claude Sonnet 4.6	30.00ドル	19.20ドル
GPT-5.4	27.50ドル	18.50ドル

計算には、通常入力100万、キャッシュ入力400万、出力100万を使用しています。ただし、キャッシュが必ず80％適用されるわけではありません。プロンプト構造、会話状態、キャッシュ保持時間、ツール利用などによって変わります。

10. 使用量を確認する方法

利用形態	確認方法	確認できる内容
Claude Pro	`Settings > Usage`	5時間枠・週間枠の消費状況とリセット時刻
Claude Code	`/context`	現在のコンテキスト使用状況
Codex	Codex usage dashboard	現在の利用枠
Codex CLI	`/status`	セッション中の残り利用枠
Claude API	Claude Console、APIレスポンス	入力、キャッシュ、出力トークン、費用
OpenAI API	Usage Dashboard、APIレスポンスの`usage`	入力、キャッシュ、出力、推論、合計トークン

OpenAIのResponses APIでは、レスポンスのusageに入力・キャッシュ入力・出力・推論・合計トークンが含まれます。また、送信前に入力トークン数を取得するエンドポイントもあります。^[14]

Anthropicには、メッセージを生成せずに入力トークン数を確認するToken Counting APIがあります。^[15]

通常のChatGPTやClaudeのサブスクリプション画面では、APIのような正確な累計入力・出力トークン数は確認できません。

11. 利用枠と費用を抑える実践方法

11.1 タスクが変わったら会話を分ける

無関係な作業を同じセッションで続けると、過去の履歴が毎回コンテキストへ含まれます。Claude Codeでは、タスクが切り替わるときに/clear、長い作業を継続するときに/compactを使う方法が公式に案内されています。^[3]

11.2 大きなファイルを無条件に貼り付けない

ファイル全体を貼り付けると、その内容が以後のコンテキストに残り続けます。次のように、対象を絞った指示の方が効率的です。

悪い例：このリポジトリ全体を確認してください。

良い例：src/auth/validate_token.py の validate_token 関数と、
関連するテストだけを確認してください。

11.3 `CLAUDE.md`や`AGENTS.md`を肥大化させない

これらのファイルは、各ターンでコンテキストへ追加される場合があります。永続的に必要な規約だけを残し、個別Issueの仕様や一時的な調査結果を詰め込みすぎないことが重要です。

11.4 出力を必要以上に長くしない

両モデルとも、出力単価は入力単価より高く設定されています。

モデル	入力単価	出力単価	出力／入力の倍率
Claude Sonnet 4.6	3.00ドル	15.00ドル	5倍
GPT-5.4	2.50ドル	15.00ドル	6倍

APIでは、「説明は不要」「差分だけ」「最大500文字」など、必要な出力を明示すると費用を抑えやすくなります。

11.5 自動化はAPI、対話作業はサブスクリプションを基本にする

用途	適した方式
日常的な設計相談、調査、実装	サブスクリプション
CI/CD、定期バッチ、複数ユーザー向け機能	API
利用上限到達後の追加作業	追加クレジットまたはAPI
月に数回だけの小規模処理	APIのみも選択肢
大規模リポジトリを継続的に扱う	サブスクリプションを基本に実績計測

12. サブスクリプションとAPIの選び方

12.1 サブスクリプションが向くケース

毎日、対話しながら設計や実装を進める
利用量を細かく気にせず作業したい
Web検索、ファイル分析、Codexのクラウド機能なども使う
月額費用を固定したい
APIキーや課金監視を管理したくない

12.2 APIが向くケース

CI/CDやバッチ処理に組み込む
アプリケーションから自動実行する
使用量と費用を正確に記録したい
月によって利用量が大きく変わる
キャッシュやモデル切り替えでコストを最適化したい

12.3 実用的な組み合わせ

個人開発では、次の構成が現実的です。

Claude Pro＋ChatGPT Plus
  ├─ 人が対話しながら行う設計・実装・レビュー
  └─ 月額固定費：合計40ドル

Claude Sonnet 4.6 API＋GPT-5.4 API
  ├─ CI/CD、定期処理、評価、ログ解析、自動レビュー
  └─ 使用したトークン分だけ従量課金

サブスクリプションをすべてAPIへ置き換えるのではなく、対話型作業はサブスクリプション、自動化はAPIと役割を分ける方が、費用と使い勝手のバランスを取りやすくなります。

13. 注意点

13.1 サブスクの損益分岐点は確定できない

サブスクリプションに含まれる総トークン量が公開されていないため、「Claude Proの20ドルはAPIの400万トークン分」「ChatGPT Plusの20ドルはAPIの436万トークン分」といった断定はできません。400万・436万トークンという数値は、API料金が20ドルになる地点であり、サブスクリプションの実容量ではありません。

13.2 コンテキスト上限と利用上限は別

100万トークンのコンテキストウィンドウがあっても、100万トークンの処理を何度でも無制限に実行できるわけではありません。

コンテキスト上限：1回の処理容量
利用上限：一定時間・週間などの総利用量
レート制限：短時間に処理できる速度
課金上限：APIで支払える金額

これらは別々に管理されます。

13.3 ツール料金を忘れない

APIでは、モデルのトークン料金以外に、Web検索、File Search、Code Interpreter／Hosted Shell、コンテナ、画像生成、データ保存、地域指定処理などの費用が発生する場合があります。大量に自動化する場合は、トークン料金だけでなく、ツール呼び出し回数も計測する必要があります。

13.4 モデルと料金は変わる

生成AIのモデル、料金、コンテキスト、サブスクリプション上限は頻繁に更新されます。公開記事には調査日を明記し、料金表を固定的な事実として長期間放置しない運用が必要です。

14. まとめ

用語	意味
トークン	AIが処理する文章・コード量の単位
メッセージ	ユーザーまたはAIが送信する1回分のまとまり
コンテキスト	今回の処理でAIが参照する情報全体
コンテキストウィンドウ	一度に扱えるコンテキストの最大容量
利用上限	一定期間にサービスを利用できる総量
レート制限	一定時間内に処理できるリクエスト・トークン量

サブスクリプションでは、総トークン上限が公開されていないため、APIとの厳密な費用比較はできません。一方、APIはトークン数と費用を正確に記録でき、自動化や継続的な処理に向いています。個人開発における現実的な考え方は、次のとおりです。

人が対話しながら進める作業はサブスクリプション、定期実行・CI/CD・アプリ組み込みはAPIを使う。

そのうえで、APIのUsage Dashboardを1か月程度記録し、実際の入力・キャッシュ・出力トークン量から契約構成を判断するのが最も確実です。

公式情報・参照元

Anthropic, What is the Pro plan? — support.claude.com
Anthropic, How do usage and length limits work? — support.claude.com
Anthropic, Models, usage, and limits in Claude Code — support.claude.com
Anthropic, Models overview — platform.claude.com
Anthropic, Pricing — platform.claude.com
Anthropic, Rate limits — platform.claude.com
Anthropic, Claude Platform release notes — platform.claude.com
OpenAI, What is ChatGPT Plus? — help.openai.com
OpenAI, Codex Pricing — developers.openai.com
OpenAI, GPT-5.4 Model — developers.openai.com
OpenAI, API Pricing — developers.openai.com
OpenAI, GPT-5.4 Rate limits — developers.openai.com
OpenAI, Reasoning models — platform.openai.com
OpenAI, Responses API reference — platform.openai.com
Anthropic, Token counting — platform.claude.com

Related Service

この整理は、生成AI × 仕様駆動開発で進めている Craft ERP の開発で、AI 利用コストをどう設計するかの検討記録です。

Research 一覧クラシス（小売向け業務アプリ）