2026年最新|OpenAI Codex アプリ版完全解説
OpenAI Codexアプリでできること完全ガイド
ChatGPTに統合されたAIソフトウェアエンジニアリングエージェント。機能・料金・GitHub連携・Claude Codeとの違いまで徹底解説します。
2025年5月、OpenAIは「Codex」という名前のクラウド型ソフトウェアエンジニアリングエージェントをリリースしました。
これは2021〜2023年ごろのコード補完モデル「旧Codex」とは全くの別物です。新しいCodexはChatGPTに統合されたAIエージェントであり、GitHubと連携してコードを書き、テストを実行し、プルリクエストまで自動で作成します。
この記事では、新しいCodexアプリで実際に何ができるのかを2026年最新の情報をもとに詳しく解説します。
OpenAI Codex(アプリ版)とは?旧Codexとは別物
まず混乱しやすいポイントを整理します。
- GPT-3ベースのコード補完モデル
- GitHub Copilotの基盤として使われた
- APIとして提供(2023年廃止)
- 自分でコードを書くツール
- クラウド型AIソフトウェアエンジニアリングエージェント
- ChatGPTに統合(chatgpt.com/codex)
- GitHubと直接連携
- コードを自律的に書いてPRまで作ってくれる
新しいCodexは「コード補完ツール」ではなく、タスクを丸ごと渡せる自律型AIエンジニアです。指示を出したらバックグラウンドで作業し、完成したらプルリクエストを持ってきます。
搭載モデル:codex-1(o3を最適化したコーディング特化版)。2026年時点でSWE-bench Verified正解率74.5%を達成しています。
Codexアプリでできること一覧
Codexアプリ(chatgpt.com/codex)でできることを機能別にまとめます。
コア機能:コードを自律的に扱う
コードの記述
機能追加・バグ修正・リファクタリングを指示だけで実行します。
テストの実行と反復
テストが通るまで自律的に修正ループを回します。
プルリクエストの自動生成
タスク完了後にブランチを作成してPRを自動で開きます。
コードベースへの質問応答
「この認証ロジックはどう動いているか」などの質問に答えます。
セキュリティスキャン
リポジトリをコミット単位でスキャンして脆弱性を検出します。
タスクの並列実行
最大6スレッドで複数タスクを同時進行できます。
アプリ固有の機能
Codexアプリには以下の機能も搭載されています。
- 内蔵ターミナル:
Cmd+Jでアクセス。ステータス確認・テスト実行・リントが可能 - Gitネイティブ操作:diff表示・インラインコメント・ステージング・コミット・プッシュ・PR作成
- アーティファクトビューア:PDF・スプレッドシート・ドキュメント・プレゼンのプレビュー
- インアプリブラウザ:ローカル開発サーバーのプレビュー(認証フロー・拡張機能は非対応)
- 画像入力:ドラッグ&ドロップで画像をコンテキストとして渡せる
- 音声入力:
Ctrl+Mでプロンプトを音声入力できる - Automations(自動化):定期的なタスク実行のスケジューリング
- メモリ(Memories):セッション間でのコンテキスト引き継ぎ
- 通知機能:タスク完了・承認要求のアラート設定
GitHubとの連携:できることが幅広い
CodexのGitHub連携はCodexの最大の特徴のひとつです。単にコードを書くだけでなく、GitHubのワークフローに直接組み込めます。
接続方法
chatgpt.com/codexにアクセスする- GitHubアカウントを認証・連携する
- 対象リポジトリを選択する
- Setup Script(セットアップスクリプト)を設定する
重要:インターネットアクセスはSetup Script実行後に無効化されます。タスク実行中にパッケージを新規インストールしたり外部APIを呼び出したりすることはできません。
GitHub上でできること
- 自動PR作成:タスク完了後に自動でブランチを作成してPRを提出
- コードレビュー:PRコメントに
@codex reviewと書くと即座にレビュー実行 - 自動レビュー:設定でリポジトリの全PRを自動レビュー
- 重大度フィルタリング:P0/P1問題のみフラグを立ててノイズを抑制
- 修正の実装:
@codex fix the P1 issueと書くとブランチに修正をプッシュ - CIエラーの修正:
@codex fix the CI failuresなどのコマンドが使える - GitHub Actions連携:Codex GitHub Actionとして組み込み可能
AGENTS.mdで永続的な指示を設定
リポジトリのルートに AGENTS.md ファイルを置くと、Codexへの永続的な指示が設定できます。
# AGENTS.md の例
## 作業ルール
- PRを開く前に必ず lint を実行すること
- public ユーティリティを変更したら docs/ に記録すること
- テストカバレッジが80%を下回るPRは作成しないこと
設定容量の上限は32KiBで、ディレクトリ階層に応じたサービス別の異なるルールも設定できます。Claude CodeにおけるCLAUDE.mdと同じような役割です。
タスクの並列・バックグラウンド実行
Codexの大きな強みのひとつが、複数タスクの同時実行とバックグラウンド処理です。
並列実行の仕様
| 項目 | 仕様 |
|---|---|
| デフォルト同時実行数 | 6スレッド(agents.max_threadsで変更可) |
| ネスト深度 | デフォルト1レベル(増やすとトークン消費が増加) |
| ワークツリー | 各サブエージェントは独立したgitワークツリーで動作 |
| 典型的な完了時間 | 1〜30分(タスクの複雑さによる) |
実際の使い方イメージ
朝のルーティン例
- 出社前に3〜5個のissueをCodexに割り当てる
- Codexがバックグラウンドでクラウド上で作業を開始する
- コーヒーを飲んで戻ると2〜3件のPRが完成している
- 差分を確認してマージするだけ
PCをシャットダウンしても作業は継続されます。OpenAIのクラウドサンドボックス上で動くためです。
料金プランと使えるユーザー
Codexは2025年5月のresearch previewから段階的に対象プランが拡大しました。2026年5月時点での対応状況は以下のとおりです。
| プラン | 月額 | Codex利用状況 |
|---|---|---|
| ChatGPT Free / Go | 無料〜低価格 | 限定的な試用のみ |
| ChatGPT Plus | $20(約3,000円) | 利用可(使用量制限あり) |
| ChatGPT Pro | $200(約30,000円) | 利用可(Plus比20倍の使用量) |
| ChatGPT Business | $30/ユーザー | 利用可 |
| Enterprise | 要相談 | 利用可 |
2026年4月2日から課金体系がメッセージ単位からAPIトークン使用量ベースに変更されました。使用量の予測・管理がしやすくなっています。
Codex CLI(OSS版)の料金:APIキーを使う場合は従量課金。軽量モデル「codex-mini」は入力$1.50/百万トークン、出力$6/百万トークン。プロンプトキャッシュで75%割引があります。
セキュリティとサンドボックス環境
コードをクラウドで実行するため、セキュリティの仕組みを理解しておくことが重要です。
クラウドサンドボックス(Codex Cloud)
- タスク実行中はインターネットアクセスが無効化される
- アクセスできるのはGitHubからクローンしたリポジトリのみ
- コード実行はすべてOpenAIのクラウドインフラで処理される
セキュリティスキャンの実績
OpenAIが事前にパブリックリポジトリ全体でテストした結果:
Claude CodeやGitHub Copilotとの違い
Codexと他のAIコーディングツールとの根本的な違いを整理します。
| 比較軸 | OpenAI Codex(Cloud) | Claude Code | GitHub Copilot |
|---|---|---|---|
| 実行場所 | OpenAIクラウド | ローカルターミナル | IDE内 |
| 操作スタイル | 非同期・委譲型 | 同期・対話型 | リアルタイム補完型 |
| 並列実行 | 最大6スレッド | なし | なし |
| GitHub連携 | ネイティブ(@codex) | git操作のみ | Copilot Workspaceで対応 |
| MCP対応 | なし(CLIはあり) | あり | なし |
| バックグラウンド実行 | あり(クラウド) | なし | なし |
| コードプライバシー | OpenAIクラウド経由 | ローカル実行 | GitHubサーバー経由 |
| IDE必須 | 不要 | 不要(ターミナル) | 必要 |
Codexが向いている場面
- 複数のissueを並行して処理したい
- PCを閉じながらコードを書かせたい
- GitHubのワークフローに直接組み込みたい
- 定義済みのタスクをバッチ処理したい
- 非技術者がChatGPT経由でコード変更を依頼したい
Claude Codeが向いている場面
- 未知のコードベースをリアルタイムで探索・理解したい
- 対話しながらデバッグしたい
- ローカルの環境変数・データベースにアクセスしながら開発したい
- MCPで外部ツールと連携したい
- コードをOpenAI側に送りたくない
補足:2026年時点でGitHub上の「Agent HQ」ではClaude CodeとCodexの両方が使えるようになっており、競合ではなく使い分ける関係です。Copilot Pro+またはCopilot Enterpriseサブスクリプションでどちらもパブリックプレビューとして利用できます。
現在の制限・できないこと
Codexは急速に進化していますが、2026年5月時点での制限も把握しておきましょう。
技術的な制限
- タスク実行中はインターネットアクセスなし:パッケージの新規インストールや外部API呼び出し不可
- GitHubのみ対応:GitLab・Bitbucket・Azure DevOpsには未対応
- デフォルト同時実行6スレッド制限
- macOSコンピューターユース機能:EEA・UK・スイスでは一部非対応
品質面での注意点
- 複雑なリファクタリングを途中で止めてしまう「lazy」な動作が報告されている
- 既存ブランチを更新せず新しいブランチを作成してしまうケースがある
- コード品質に満足できる確率が初期ユーザーから「40〜60%程度」という声もある
最新の進化:2025年5月から2026年5月まで
Codexはリリースからわずか1年で急速に進化しました。主な節目をまとめます。
Pro・Enterprise・Team向けに公開。codex-1モデルを搭載。
Plusユーザーもアクセス可能に。日次利用が10倍以上に成長。
SWE-bench Verified正解率74.5%。セキュリティスキャン機能を追加。
実行中にユーザーが途中介入できる「同僚モード」を初実装。
トークン使用量ベースの課金に移行。インアプリブラウザ追加。
OpenAI社内の事例:3人チームがCodexのみを使い、手動でコードを1行も書かずに5ヶ月で100万行の本番コードを生成し、1,500件のPRをマージしました。OpenAIはこれを「ハーネスエンジニアリング」と呼んでいます。
よくある質問
Codex CLIとCodexアプリの違いは?
Codex CLIはターミナルから使うOSS版で、APIキーを使った従量課金で動きます。Codexアプリ(chatgpt.com/codex)はChatGPTのサブスクリプションで使えるクラウド版で、GUIで操作できます。どちらもGitHub連携ができますが、アプリ版のほうが非技術者にも使いやすい設計です。
日本語での指示は通る?
通ります。日本語でタスクを指示できますし、AGENTS.mdやコメントも日本語で書けます。ただし英語のほうが精度が高いケースがあるため、重要なタスクは英語での指示も試してみることをおすすめします。
プライベートリポジトリでも使える?
使えます。GitHubの認証設定でアクセス許可したリポジトリに対してCodexが作業します。コードはOpenAIのクラウドサンドボックスで処理されるため、プライバシーポリシーを事前に確認してください。
対応プログラミング言語は?
12以上の言語に対応しています。Python・JavaScript/TypeScript・Go・Ruby・Swift・Shell・Perl・PHP・C++・C#・Javaなどが確認されています。特にPythonの精度が最も高いとされています。
まとめ
OpenAI Codex(アプリ版)は「コードを書いてもらうツール」ではなく、GitHubのワークフローに自律型AIエンジニアを追加するという新しいアプローチです。
Codexアプリの重要ポイント
- 旧Codexとは別物。2025年5月リリースのクラウド型AIエージェント
- GitHubに
@codexコマンドで直接指示できる - 最大6スレッドの並列実行でPCを閉じながら作業させられる
- AGENTS.mdでリポジトリ固有のルールを設定できる
- ChatGPT Plusから利用可能(月額$20〜)
- Claude Codeとは競合ではなく使い分ける存在
- タスク実行中はインターネットアクセスが無効になる点に注意
非同期・委譲型のCodexと、対話型のClaude Codeを使い分けることで、開発効率は大きく変わります。定型タスクの自動化にはCodex、未知コードの探索やリアルタイムデバッグにはClaude Codeという使い分けが現実的です。

