米OpenAIは、AIを活用した画像生成ツール「ChatGPT Images 2.0」の最新版を発表した。新たに導入された「思考機能」により、ウェブ検索を通じて情報を取得し、1つのプロンプトから複数の画像を生成できるようになった。

同社の公式ブログによると、ChatGPT Images 2.0は、指示の理解力やテキスト生成能力、細部の再現性が向上しており、より高度な画像を作成可能だという。この機能は、新しい画像生成モデル「GPT Image 2」を基盤としている。

思考モデルが選択された場合、チャットボットの画像生成機能はウェブ上の情報を活用して、ユーザーのリクエストに応じた画像を複数同時に作成できる。この機能は、ChatGPT Plus、Pro、Business、Enterpriseの各有料プランで利用可能となっている。

例えば、ユーザーが「夏のビーチでバーベキューをしている人々」と入力すると、思考モデルがウェブ上の関連画像や情報を参考に、複数のシーンや構図を生成する。これにより、より多様で具体的な画像を短時間で作成できるようになる。

OpenAIは、このアップデートにより、画像生成の精度と柔軟性が大幅に向上すると説明している。また、テキストの正確性や細部の表現力も強化されており、プロンプトの指示に忠実な画像を生成しやすくなったという。

今後、AI画像生成技術の進化により、クリエイティブ業界やマーケティング分野での活用がさらに広がることが期待される。

出典: The Verge