OpenAI Codexアプリ完全解説
PCを自律操作するAI開発エージェント——使い方・料金・Claude Codeとの比較まで
2026年4月16日、OpenAIは Codex アプリの大型アップデート「Codex for almost everything」を発表しました。コード補完ツールとして始まった Codex は、今やPCを自律的に操作し、複数タスクをバックグラウンドで並列実行できる開発者向け汎用エージェントへと変貌しています。
4月23日には最新モデル GPT-5.5 も統合され、週間300万人以上の開発者が利用するツールへと成長しました。
本記事では Codex アプリの概要・主要機能・料金・Claude Code との比較まで、2026年4月時点の最新情報を網羅的に解説します。
目次
1. Codexアプリとは何か
OpenAI Codex アプリは、コーディング専用の AI エージェント向けデスクトップアプリです。OpenAI 自身は「コーディングの指令センター(command center for agentic coding)」と表現しています。
2026年4月の大型アップデート以降は「コーディング」の枠を超え、macOS 上で AI カーソルが画面を操作するComputer Use機能や、Slack・Notion・GitHub など90以上の外部サービスとのプラグイン連携、長期タスクのスケジューリングなど、汎用的な作業エージェントとしての性格が強まっています。
GitHub で公開されているオープンソースの openai/codex(CLI ツール)とは別の独立したアプリです。CLI はターミナルベースで Apache 2.0 ライセンスで公開されているのに対し、アプリ版は GUI 操作・Computer Use・並列ワークツリーなどが追加された独自製品です。どちらも OpenAI アカウントで使います。
2. リリース履歴とアップデートの流れ
| 日付 | 出来事 |
|---|---|
| 2026年2月2日 | macOS 版アプリを正式リリース(「Introducing the Codex app」) |
| 2026年3月4日 | Windows 版リリース |
| 2026年4月16日 | 大型アップデート「Codex for almost everything」発表。Computer Use・プラグイン・メモリ機能など追加 |
| 2026年4月23日 | GPT-5.5 を Codex に統合。SWE-bench が 88.7% に向上 |
2月のリリース時はコード生成・レビューが中心でしたが、4月16日のアップデートで「より広い作業範囲・より深い統合・より長い継続性」の3方向に大きく拡張されました。
3. 主要機能・できること
① Computer Use(PC自動操作)
最も注目される新機能です。macOS 上で AI カーソルが画面を認識してクリック・入力・スクロールを自動実行します。複数のエージェントをバックグラウンドで並列実行できるため、朝にタスクをキューイングして別の作業を続けながら進捗を確認する「2層構造」の活用が開発者の間で広まっています。
Windows 版アプリはリリースされていますが、Computer Use 機能は現時点で macOS 限定です。また EU・英国・スイスでは提供が遅延しています。
② アプリ内ブラウザ
localhost の開発サーバーをアプリ内で開き、表示中のページに直接コメントを書いて指示できます。「このボタンの色を変えて」「このレイアウトを修正して」とビジュアルで指示できるため、フロントエンド開発やゲーム開発で特に効果的です。
③ 並列ワークツリー
複数プロジェクトのスレッドを同時実行し、Git ワークツリーで変更を分離管理します。「機能Aのブランチ」「テスト修正のブランチ」「ドキュメント更新」を同時進行させ、それぞれのPRを並べてレビューするワークフローが可能です。
④ コードレビュー統合
PR の差分確認・フィードバック対応・ファイルのステージ・コミット・プッシュをアプリ内で完結させられます。GitHub との連携が前提になっているため、GitHub ユーザーは特に恩恵を受けやすいです。
⑤ メモリ機能(プレビュー)
過去の会話・好み・修正点を記憶し次回セッションに引き継ぎます。「インデントは2スペース」「コメントは日本語で」といった設定を毎回説明する手間がなくなります。現時点では Enterprise・Edu 向けから先行展開中です。
⑥ スケジューリング・長期タスク
スレッドを定期的に自動再開し、数日〜数週間にわたる長期タスクを継続実行させられます。「毎朝テストを回して結果をまとめておいて」といった繰り返し作業に向いています。
⑦ 画像生成・編集
gpt-image-1.5 を搭載し、UI モックアップやコンセプト画像をアプリ内で生成・編集できます。スクリーンショットへの手書き指示にも対応しています。ただしテキストタスク比で3〜5倍速くクレジットを消費するため注意が必要です。
⑧ 90以上のプラグイン
Slack・Notion・GitLab Issues・CircleCI・Jira・Microsoft Suite・CodeRabbit・Atlassian Rovo など、90を超える外部サービスと連携できます。コーディング作業と周辺ツールの操作を一か所に集約できます。
4. 料金・プラン
| プラン | 月額 | Codex利用 |
|---|---|---|
| Free / Go | 無料〜限定 | 期間限定プロモーション提供中 |
| Plus | $20 | 基本利用可能 |
| Pro(新設) | $100 | Plus 比5倍の利用制限(5月31日まで10倍特典あり) |
| Business | $30/ユーザー | 対応 |
| Enterprise / Edu | 要問い合わせ | 対応(メモリ機能が先行展開) |
料金体系がメッセージ単位からAPIトークン単位に変更されました。Proプランも従来の$200から$100に新設され、Plusとの中間プランが追加されています。画像生成タスクはテキスト比3〜5倍のクレジット消費となる点に注意してください。
5. 使い方・操作方法
基本的な開始手順
- Codex アプリを公式サイトからダウンロード・インストール(macOS または Windows)
- ChatGPT アカウントまたは OpenAI API キーでサインイン
- プロジェクトフォルダを選択
- 最初のメッセージ(指示)を送信
実務で効果的な使い方パターン
朝に3〜5タスクをキューイングしてバックグラウンドで並列実行させながら別の作業をこなし、定期的に結果を確認するワークフローが開発者の間で広まっています。通常の集中作業を妨げずに Codex が裏で動き続けます。
- mid-task steering:タスク実行中にリアルタイムで介入・リダイレクトが可能
- 実装アプローチの選択:タスク開始時に2〜4つの実装アプローチを提示してくれるプレビュー機能あり
- モデル切り替え:アプリのモデルセレクタから GPT-5.5・GPT-5.4 など複数モデルを選択可能
- PR ワークフロー:GitHub PR の作成・レビュー・マージをアプリ内で完結
6. Claude Code との比較
| 比較項目 | Codex アプリ | Claude Code |
|---|---|---|
| 形態 | GUIデスクトップアプリ(+CLI) | CLI(コマンドライン) |
| Terminal-Bench 2.0 | 77.3% | 65.4% |
| SWE-bench Verified | 64.7% | 80.8% |
| ユーザー満足度 | 3.4 / 5 | 4.0 / 5 |
| コンテキストウィンドウ | 400K〜1M(モデルによる) | 1M |
| Computer Use(PC操作) | 対応(macOS のみ) | なし |
| GUI | あり(デスクトップアプリ) | なし(CLI のみ) |
| 並列実行 | 対応(マルチワークツリー) | 限定的 |
| プラグイン | 90以上 | MCP 連携 |
| メモリ機能 | あり(プレビュー) | なし(CLAUDE.md で代替) |
| ライセンス(CLI) | Apache 2.0 | プロプライエタリ |
使い分けの指針
- ターミナル操作・OS 自動化を大量にこなしたい
- GUI で直感的に操作したい
- 複数タスクをバックグラウンドで並列実行したい
- Slack・Jira などの外部ツールと連携したい
- フロントエンドをビジュアルで指示したい
- 大規模・複雑なソフトウェアエンジニアリング
- 1Mトークンの長大なコードベースを扱いたい
- CLAUDE.md・Hooks・Skill で細かくカスタマイズしたい
- ターミナルとの親和性を重視する
- ユーザー満足度・安定性を優先する
7. 使えるモデル(GPT-5.5との関係)
2026年4月23日、最新フロンティアモデルの GPT-5.5 が Codex に統合されました。
| モデル | 特徴 | 推奨用途 |
|---|---|---|
| GPT-5.5 | 最新・最高性能。SWE-bench 88.7% | 複雑なコーディング・Computer Use |
| GPT-5.5 Thinking | 拡張推論版 | 深い熟考が必要なタスク |
| GPT-5.4 | 1M コンテキスト対応 | 長大なコードベースの処理 |
| GPT-5.4-mini | 軽量・高速 | 軽いタスク・サブエージェント |
| GPT-5.3-codex | コーディング特化版 | 複雑なソフトウェアエンジニアリング |
| GPT-5.3-codex-spark | リアルタイムコード反復特化 | 高速イテレーション |
GPT-5.5 の Codex 統合後、SWE-bench(実世界の GitHub 課題解決ベンチマーク)が 88.7% を記録。これは GPT-5.4 時代から大幅に向上した数字です。NVIDIA も自社の開発ワークフローに Codex + GPT-5.5 を活用していると発表しています。
8. 制限事項・注意点
- Computer Use は macOS のみ:Windows 版アプリはあるが PC 自動操作は macOS 限定
- EU・英国・スイスで一部機能が遅延:Computer Use・メモリ機能・Chronicle のスクリーンキャプチャが未提供
- GitHub 依存:すべてのタスクが GitHub リポジトリをプリロードしたクラウドサンドボックスで実行。GitHub 非連携プロジェクトや制限インターネット環境では機能しない
- 画像生成のコスト:テキストタスク比3〜5倍速くクレジットを消費
- メモリ機能はプレビュー段階:Enterprise・Edu から先行展開中
- セキュリティ懸念:Chronicle のスクリーンキャプチャはクラウド処理で暗号化なしと一部メディアが指摘
- モデル選択の透明性:システムが自動選択する場面があり、ユーザーが関与できない場合がある
- Codex API は「coming soon」:API 経由での直接アクセスはまだ完全展開されていない
9. 実際の評価・レビュー
肯定的な評価
WorkOS の開発者 Zack Proser 氏は「実験的なツールから不可欠な生産インフラへ進化した」と評価。同社全体で開発時間の30〜40%を削減し、保守タスクの成功率が40〜60%から85〜90%に向上したと報告しています。
- エラーハンドリングが格段に改善。不可解な失敗ではなく明確なエラーメッセージと修正提案が表示されるようになった
- タスク開始時に2〜4つの実装アプローチを提示するプレビュー機能が特に便利と評価
- mid-task steering(実行中の介入)が可能になり、方向性が間違っていてもすぐ軌道修正できる
批判的な評価
複数のレビューサイトでの評価は Codex 3.4/5 に対して Claude Code 4.0/5。コードのリファクタリングタスクが苦手・デフォルトで推論プロセスを表示しないため監視しにくい・コンテキストウィンドウが Claude Code より狭い、といった点が指摘されています。
まとめ
まとめ
- Codex アプリはコード補完ツールから「PCを自律操作できる開発者向け汎用エージェント」へと進化
- 2026年4月16日の大型アップデートで Computer Use・90以上のプラグイン・メモリ機能・スケジューリングが追加
- $20の Plus プランから基本利用可能。新設の $100 Pro プランは5月31日まで10倍特典あり
- ターミナル操作(Terminal-Bench 77.3%)・GUI・並列実行ではCodex が優位
- 大規模ソフトウェアエンジニアリング(SWE-bench 80.8%)・満足度ではClaude Code が優位
- GPT-5.5 統合後は SWE-bench が 88.7% に向上。モデルは複数から選択可能
- Computer Use は現在 macOS のみ。GitHub 依存・EU 制限など注意点あり
- 「朝にキューイング → バックグラウンド並列実行 → 結果確認」の2層構造が実務で人気の使い方
Codex アプリは Claude Code と競合するというよりも、GUI・並列実行・PC自動操作を好む開発者とターミナル・大規模タスク・カスタマイズを重視する開発者で棲み分けが生まれつつあります。両ツールを目的別に使い分けるのが、2026年現在の現実的な選択肢です。
関連記事もあわせてどうぞ
Claude Code vs OpenAI Codex CLI 比較・GPT-5.5 完全解説・Claude Code MCP 実践入門
