OpenAIは先月、米ウォールストリート・ジャーナルの報道を受け、ChatGPT、コーディングエージェントCodex、ウェブブラウザAtlasを統合したデスクトップ向け「スーパーアプリ」の開発を発表したが、現時点ではリリースされていない。同社はその代わりに、Codexに大規模なアップデートを実施し、機能を大幅に拡張した。

「私たちはスーパーアプリをオープンに構築しています」と、Codex責任者のティボー・ソティアックス氏は記者会見で述べた。「今回のリリースは開発者向けのものです。将来的には、より幅広いユーザーに対応する予定です」と説明した。

マルチエージェント機能でPC操作を自動化

最新版のCodexでは、マルチエージェント機能が強化され、開発者はより広範なタスクに対応できるようになった。特に注目されるのがPC操作機能だ。Codexのエージェントは、ユーザーの指示に基づいて他のアプリケーションと連携し、タスクを実行できる。

例えば、特定のプログラム名を指定するか、最適なアプリケーションを自動で選択させることが可能だ。競合するサービス(例:Claude Cowork)でも同様の機能は存在するが、OpenAIはCodexの優位性として、「システム全体を重くすることなく、エージェントがアプリを操作できる」点を挙げている。これにより、ユーザーとエージェントが同時に作業を進められるという。

111種類の新プラグインと組み込みブラウザ機能

OpenAIは今回、111種類の新プラグインをリリースした。これらのプラグインは、スキル、アプリ連携、モデルコンテキストプロトコルサーバー接続を組み合わせ、Codexがより多くのコンテキストを収集し、開発者が依存するツールを活用できるように設計されている。

さらに、組み込みブラウザ機能も追加された。この機能を使えば、ユーザーはウェブページやウェブアプリの特定の部分を指定して、Codexに修正を依頼できる。例えば、グラフの余白を調整したり、レイアウトを変更したりすることが可能だ。同社のデモでは、Codexチームのメンバーがこの機能を使って、y軸が切れないようにグラフの余白を調整する様子が披露された。

画像生成機能とメモリ機能も強化

Codexには、画像生成機能も搭載された。gpt-image-1.5を活用し、プロダクトコンセプト、モックアップ、フロントエンドデザイン、さらにはシンプルなゲームのアセットまで生成できる。また、スクリーンショットを使って、ユーザーのリクエストに沿った作業ができているかを確認する機能も追加された。

さらに、メモリ機能もプレビュー公開された。1つ目の機能は、過去のタスクからのコンテキストを記憶し、将来のプロンプトに活かすというものだ。OpenAIによると、時間の経過とともに、Codexはリクエストをより迅速かつ高品質に処理できるようになるという。また、蓄積したコンテキストを基に、プロアクティブな提案も行う。例えば、朝一番に、Google Docsの下書きに同僚からコメントがついていることを通知し、対応を促すといった具合だ。

開発者向けに段階的ロールアウトを実施

最新版のCodexは、デスクトップアプリにログインしているユーザーを対象に、段階的に提供が開始されている。開発者は現在、これらの新機能を試すことができる。

出典: Engadget