ChatGPTが新たにリリースした画像生成エンジン「Images 2.0」は、従来の画像エンジンに比べて大幅な改善が見られる。具体的には、テキストの見栄え(タイポグラフィ)の向上、Web検索機能の統合、そして論理的な推論機能の搭載が特徴だ。これにより、消費者向けだけでなく、ビジネスシーンでの活用も視野に入れた高い実用性が期待される。
「Images 2.0」の主な機能
「Images 2.0」は、現在ChatGPTアプリ内で利用可能となっている。主な特徴は以下の通りだ。
- 多様なアスペクト比のサポート:幅広い画像サイズに対応し、用途に応じた柔軟な画像生成が可能。
- 2つのモードを提供:
- スタンダードモード:全ユーザーが利用可能な基本モード。
- シンキングモード:有料サブスクリプションユーザー向けのモードで、内蔵された推論機能により、より精度の高い画像生成が可能。
実用性を検証:実際のユースケースでテスト
筆者は「Images 2.0」を1日使用し、さまざまなタスクに対応できるか検証した。その結果、以下のような成果が得られた。
1. パーソナライズされた追悼画像の生成
友人から、最近亡くなった愛猫とお気に入りのおもちゃを使った追悼画像を依頼された。エンジンは、まるで個人に特化されたお悔やみカードのような、高いレベルのパーソナライズされた画像を生成した。
2. ウェディング写真のアルバム風加工
2枚のウェディング写真を、古いアルバム風に加工してもらった。写真の角が丸くなり、まるで昔の写真アルバムに収められたかのような仕上がりとなった。
3. 架空のイベントポスター作成
同僚から、架空のイベント「Mike Allen似顔絵コンテスト」のポスター作成を依頼された。指定された日時と場所(ワシントン・スクエア・パーク)を反映したポスターを生成。もちろん、このイベントは架空のものであり、実際に開催されることはない。
4. 説得力のあるインフォグラフィック
「キャンディコーン反対論」をテーマにしたインフォグラフィックを作成。この画像を使って、同僚2人を説得しようとしたが、残念ながら効果はなかった。キャンディコーンが「キャンディでもコーンでもない」という事実を伝えるのに、この画像は十分な説得力を持っていたが、味覚の問題は別の話だったようだ。
5. 部屋の整理整頓シミュレーション
自室の写真をアップロードし、部屋が片付いた状態の画像を生成してもらった。その結果、今まで気付かなかった広さに驚いたが、パートナーからは「実際に片付けてから言ってくれ」と冷静な反応をされた。
6. スポーツカード風の画像生成
筆者と13歳の息子がソフトボールとサッカーをしている写真から、トレーディングカード風の画像を生成。名前、ポジション、チームロゴなど、ユニフォームから抽出した情報をもとに、リアルなカードが完成した。
課題点と改善の余地
一方で、いくつかの課題も明らかになった。
1. 新聞風画像の精度不足
「Smart Brevity Times」という架空の新聞を、最新のAxiosの見出しを基に生成してもらった。1度目の試行では古い記事が使用され、2度目の試行では最新の記事が反映されたものの、完成度は低く、本物の新聞のような仕上がりにはならなかった。
2. 画像の完成度にばらつき
麻雀のチートシートを依頼したところ、内容は正確だったものの、デザイン面で洗練されていない仕上がりとなった。
3. 生成時間の長さ
シンキングモードを使用すると、画像の生成に時間がかかることがわかった。これは、内蔵された推論機能による処理の複雑さが原因と考えられる。
まとめ:ビジネス利用に向けた可能性と課題
「Images 2.0」は、単なる画像生成エンジンを超えた機能を提供しており、パーソナライズされた画像生成や、論理的な推論を活かしたクリエイティブなタスクに対応できる。しかし、完成度や生成時間の面で改善の余地があり、ビジネスシーンでの本格的な活用にはさらなる進化が求められる。
今後、これらの課題が解決されれば、ChatGPTの画像エンジンは、マーケティング、教育、エンターテイメントなど、幅広い分野での活用が期待されるだろう。