OpenAI Codexアプリでできること完全ガイド【2026年最新】ChatGPTに統合されたAIエンジニアリングエージェントの機能・料金・使い方

ChatGPTとGitHubが連携するOpenAI Codexアプリのイラスト AI

2026年最新|OpenAI Codex アプリ版完全解説

OpenAI Codexアプリでできること完全ガイド

ChatGPTに統合されたAIソフトウェアエンジニアリングエージェント。機能・料金・GitHub連携・Claude Codeとの違いまで徹底解説します。

2025年5月、OpenAIは「Codex」という名前のクラウド型ソフトウェアエンジニアリングエージェントをリリースしました。

これは2021〜2023年ごろのコード補完モデル「旧Codex」とは全くの別物です。新しいCodexはChatGPTに統合されたAIエージェントであり、GitHubと連携してコードを書き、テストを実行し、プルリクエストまで自動で作成します。

この記事では、新しいCodexアプリで実際に何ができるのかを2026年最新の情報をもとに詳しく解説します。

スポンサーリンク

OpenAI Codex(アプリ版)とは?旧Codexとは別物

まず混乱しやすいポイントを整理します。

旧Codex(2021〜2023年)
  • GPT-3ベースのコード補完モデル
  • GitHub Copilotの基盤として使われた
  • APIとして提供(2023年廃止)
  • 自分でコードを書くツール
新Codex(2025年5月〜)
  • クラウド型AIソフトウェアエンジニアリングエージェント
  • ChatGPTに統合(chatgpt.com/codex)
  • GitHubと直接連携
  • コードを自律的に書いてPRまで作ってくれる

新しいCodexは「コード補完ツール」ではなく、タスクを丸ごと渡せる自律型AIエンジニアです。指示を出したらバックグラウンドで作業し、完成したらプルリクエストを持ってきます。

搭載モデル:codex-1(o3を最適化したコーディング特化版)。2026年時点でSWE-bench Verified正解率74.5%を達成しています。

Codexアプリでできること一覧

Codexアプリ(chatgpt.com/codex)でできることを機能別にまとめます。

コア機能:コードを自律的に扱う

📝

コードの記述

機能追加・バグ修正・リファクタリングを指示だけで実行します。

🧪

テストの実行と反復

テストが通るまで自律的に修正ループを回します。

🔀

プルリクエストの自動生成

タスク完了後にブランチを作成してPRを自動で開きます。

💬

コードベースへの質問応答

「この認証ロジックはどう動いているか」などの質問に答えます。

🔒

セキュリティスキャン

リポジトリをコミット単位でスキャンして脆弱性を検出します。

タスクの並列実行

最大6スレッドで複数タスクを同時進行できます。

アプリ固有の機能

Codexアプリには以下の機能も搭載されています。

  • 内蔵ターミナルCmd+Jでアクセス。ステータス確認・テスト実行・リントが可能
  • Gitネイティブ操作:diff表示・インラインコメント・ステージング・コミット・プッシュ・PR作成
  • アーティファクトビューア:PDF・スプレッドシート・ドキュメント・プレゼンのプレビュー
  • インアプリブラウザ:ローカル開発サーバーのプレビュー(認証フロー・拡張機能は非対応)
  • 画像入力:ドラッグ&ドロップで画像をコンテキストとして渡せる
  • 音声入力Ctrl+Mでプロンプトを音声入力できる
  • Automations(自動化):定期的なタスク実行のスケジューリング
  • メモリ(Memories):セッション間でのコンテキスト引き継ぎ
  • 通知機能:タスク完了・承認要求のアラート設定

GitHubとの連携:できることが幅広い

CodexのGitHub連携はCodexの最大の特徴のひとつです。単にコードを書くだけでなく、GitHubのワークフローに直接組み込めます。

接続方法

  1. chatgpt.com/codex にアクセスする
  2. GitHubアカウントを認証・連携する
  3. 対象リポジトリを選択する
  4. Setup Script(セットアップスクリプト)を設定する

重要:インターネットアクセスはSetup Script実行後に無効化されます。タスク実行中にパッケージを新規インストールしたり外部APIを呼び出したりすることはできません。

GitHub上でできること

  • 自動PR作成:タスク完了後に自動でブランチを作成してPRを提出
  • コードレビュー:PRコメントに @codex review と書くと即座にレビュー実行
  • 自動レビュー:設定でリポジトリの全PRを自動レビュー
  • 重大度フィルタリング:P0/P1問題のみフラグを立ててノイズを抑制
  • 修正の実装@codex fix the P1 issue と書くとブランチに修正をプッシュ
  • CIエラーの修正@codex fix the CI failures などのコマンドが使える
  • GitHub Actions連携:Codex GitHub Actionとして組み込み可能

AGENTS.mdで永続的な指示を設定

リポジトリのルートに AGENTS.md ファイルを置くと、Codexへの永続的な指示が設定できます。

# AGENTS.md の例
## 作業ルール
- PRを開く前に必ず lint を実行すること
- public ユーティリティを変更したら docs/ に記録すること
- テストカバレッジが80%を下回るPRは作成しないこと

設定容量の上限は32KiBで、ディレクトリ階層に応じたサービス別の異なるルールも設定できます。Claude CodeにおけるCLAUDE.mdと同じような役割です。

タスクの並列・バックグラウンド実行

Codexの大きな強みのひとつが、複数タスクの同時実行とバックグラウンド処理です。

並列実行の仕様

項目仕様
デフォルト同時実行数6スレッド(agents.max_threadsで変更可)
ネスト深度デフォルト1レベル(増やすとトークン消費が増加)
ワークツリー各サブエージェントは独立したgitワークツリーで動作
典型的な完了時間1〜30分(タスクの複雑さによる)

実際の使い方イメージ

朝のルーティン例

  1. 出社前に3〜5個のissueをCodexに割り当てる
  2. Codexがバックグラウンドでクラウド上で作業を開始する
  3. コーヒーを飲んで戻ると2〜3件のPRが完成している
  4. 差分を確認してマージするだけ

PCをシャットダウンしても作業は継続されます。OpenAIのクラウドサンドボックス上で動くためです。

料金プランと使えるユーザー

Codexは2025年5月のresearch previewから段階的に対象プランが拡大しました。2026年5月時点での対応状況は以下のとおりです。

プラン月額Codex利用状況
ChatGPT Free / Go無料〜低価格限定的な試用のみ
ChatGPT Plus$20(約3,000円)利用可(使用量制限あり)
ChatGPT Pro$200(約30,000円)利用可(Plus比20倍の使用量)
ChatGPT Business$30/ユーザー利用可
Enterprise要相談利用可

2026年4月2日から課金体系がメッセージ単位からAPIトークン使用量ベースに変更されました。使用量の予測・管理がしやすくなっています。

Codex CLI(OSS版)の料金:APIキーを使う場合は従量課金。軽量モデル「codex-mini」は入力$1.50/百万トークン、出力$6/百万トークン。プロンプトキャッシュで75%割引があります。

セキュリティとサンドボックス環境

コードをクラウドで実行するため、セキュリティの仕組みを理解しておくことが重要です。

クラウドサンドボックス(Codex Cloud)

  • タスク実行中はインターネットアクセスが無効化される
  • アクセスできるのはGitHubからクローンしたリポジトリのみ
  • コード実行はすべてOpenAIのクラウドインフラで処理される

セキュリティスキャンの実績

OpenAIが事前にパブリックリポジトリ全体でテストした結果:

792件
クリティカルな脆弱性を発見
10,561件
高重要度の脆弱性を発見
50%以上
誤検知率の削減

Claude CodeやGitHub Copilotとの違い

Codexと他のAIコーディングツールとの根本的な違いを整理します。

比較軸OpenAI Codex(Cloud)Claude CodeGitHub Copilot
実行場所OpenAIクラウドローカルターミナルIDE内
操作スタイル非同期・委譲型同期・対話型リアルタイム補完型
並列実行最大6スレッドなしなし
GitHub連携ネイティブ(@codex)git操作のみCopilot Workspaceで対応
MCP対応なし(CLIはあり)ありなし
バックグラウンド実行あり(クラウド)なしなし
コードプライバシーOpenAIクラウド経由ローカル実行GitHubサーバー経由
IDE必須不要不要(ターミナル)必要

Codexが向いている場面

  • 複数のissueを並行して処理したい
  • PCを閉じながらコードを書かせたい
  • GitHubのワークフローに直接組み込みたい
  • 定義済みのタスクをバッチ処理したい
  • 非技術者がChatGPT経由でコード変更を依頼したい

Claude Codeが向いている場面

  • 未知のコードベースをリアルタイムで探索・理解したい
  • 対話しながらデバッグしたい
  • ローカルの環境変数・データベースにアクセスしながら開発したい
  • MCPで外部ツールと連携したい
  • コードをOpenAI側に送りたくない

補足:2026年時点でGitHub上の「Agent HQ」ではClaude CodeとCodexの両方が使えるようになっており、競合ではなく使い分ける関係です。Copilot Pro+またはCopilot Enterpriseサブスクリプションでどちらもパブリックプレビューとして利用できます。

現在の制限・できないこと

Codexは急速に進化していますが、2026年5月時点での制限も把握しておきましょう。

技術的な制限

  • タスク実行中はインターネットアクセスなし:パッケージの新規インストールや外部API呼び出し不可
  • GitHubのみ対応:GitLab・Bitbucket・Azure DevOpsには未対応
  • デフォルト同時実行6スレッド制限
  • macOSコンピューターユース機能:EEA・UK・スイスでは一部非対応

品質面での注意点

  • 複雑なリファクタリングを途中で止めてしまう「lazy」な動作が報告されている
  • 既存ブランチを更新せず新しいブランチを作成してしまうケースがある
  • コード品質に満足できる確率が初期ユーザーから「40〜60%程度」という声もある

最新の進化:2025年5月から2026年5月まで

Codexはリリースからわずか1年で急速に進化しました。主な節目をまとめます。

2025年5月16日
新Codex誕生(Research Preview)

Pro・Enterprise・Team向けに公開。codex-1モデルを搭載。

2025年6月〜
一般提供(GA)・Plus拡大

Plusユーザーもアクセス可能に。日次利用が10倍以上に成長。

2025年12月18日
GPT-5.2-Codex登場

SWE-bench Verified正解率74.5%。セキュリティスキャン機能を追加。

2026年2月5日
GPT-5.3-Codex発表

実行中にユーザーが途中介入できる「同僚モード」を初実装。

2026年4月〜
GPT-5.5が最推奨モデルに・課金体系変更

トークン使用量ベースの課金に移行。インアプリブラウザ追加。

OpenAI社内の事例:3人チームがCodexのみを使い、手動でコードを1行も書かずに5ヶ月で100万行の本番コードを生成し、1,500件のPRをマージしました。OpenAIはこれを「ハーネスエンジニアリング」と呼んでいます。

よくある質問

Codex CLIとCodexアプリの違いは?

Codex CLIはターミナルから使うOSS版で、APIキーを使った従量課金で動きます。Codexアプリ(chatgpt.com/codex)はChatGPTのサブスクリプションで使えるクラウド版で、GUIで操作できます。どちらもGitHub連携ができますが、アプリ版のほうが非技術者にも使いやすい設計です。

日本語での指示は通る?

通ります。日本語でタスクを指示できますし、AGENTS.mdやコメントも日本語で書けます。ただし英語のほうが精度が高いケースがあるため、重要なタスクは英語での指示も試してみることをおすすめします。

プライベートリポジトリでも使える?

使えます。GitHubの認証設定でアクセス許可したリポジトリに対してCodexが作業します。コードはOpenAIのクラウドサンドボックスで処理されるため、プライバシーポリシーを事前に確認してください。

対応プログラミング言語は?

12以上の言語に対応しています。Python・JavaScript/TypeScript・Go・Ruby・Swift・Shell・Perl・PHP・C++・C#・Javaなどが確認されています。特にPythonの精度が最も高いとされています。

まとめ

OpenAI Codex(アプリ版)は「コードを書いてもらうツール」ではなく、GitHubのワークフローに自律型AIエンジニアを追加するという新しいアプローチです。

Codexアプリの重要ポイント

  • 旧Codexとは別物。2025年5月リリースのクラウド型AIエージェント
  • GitHubに @codex コマンドで直接指示できる
  • 最大6スレッドの並列実行でPCを閉じながら作業させられる
  • AGENTS.mdでリポジトリ固有のルールを設定できる
  • ChatGPT Plusから利用可能(月額$20〜)
  • Claude Codeとは競合ではなく使い分ける存在
  • タスク実行中はインターネットアクセスが無効になる点に注意

非同期・委譲型のCodexと、対話型のClaude Codeを使い分けることで、開発効率は大きく変わります。定型タスクの自動化にはCodex、未知コードの探索やリアルタイムデバッグにはClaude Codeという使い分けが現実的です。

タイトルとURLをコピーしました