米OpenAIは現地時間10月29日、ChatGPTの画像生成エンジン「ChatGPT Images 2.0」を発表した。同社によると、テキスト処理能力と複雑なリクエストへの対応力が大幅に向上したという。
新機能の主な特徴は以下の通り:
- 多様なアスペクト比に対応:幅広い画像サイズに対応し、用途に応じた柔軟な出力が可能
- 2つの動作モード:標準モードは全ユーザーが利用可能。有料ユーザー向けの「思考モード」では、内蔵推論機能により高度なリクエストに対応
- API経由での提供:開発者は新モデルをAPI経由で利用できる
ただし、思考モードを使用すると画像生成に時間がかかる点に注意が必要だ。
競争の激化と今後の展望
AI業界では、新モデルの登場が話題を呼び、アプリのダウンロード数急増につながるケースが多い。昨年にはGoogleが「Nano Banana」を発表し注目を集めた。OpenAIも数ヶ月前に能力向上版を発表し、スタジオジブリ風の画像が特に注目を集めた。
OpenAIのプロダクトマネージャー、Adele Li氏は記者会見で「今回も新たな注目が集まる瞬間になると期待している」と述べた。さらに、新モデルは広告、ポスター、モックアップなどのプロフェッショナルな用途にも適していると強調した。
「これは単なる美しい画像を生成するツールではありません。クリエイティブなアシスタントです」
— Adele Li, OpenAI プロダクトマネージャー
Li氏はまた、どのような画像が注目を集めるかは予測できないとしつつも、新モデルが新たなムーブメントを生み出す可能性を示唆した。
専門家の見解
AI画像生成分野では、リードを保つのは一時的なものであり、新たなモデルが追いつき、時には追い越すことが常だ。今回のアップデートが業界全体の技術向上につながることが期待される。
出典:
Axios