Новая эра генерации изображений с ChatGPT Images 2.0
Компания OpenAI представила обновлённую версию ChatGPT Images 2.0 — инструмента для генерации изображений на основе текстовых запросов. По словам разработчиков, это значительный шаг вперёд в развитии моделей генерации изображений, особенно в части точного выполнения инструкций, рендеринга сложных текстов и корректного размещения объектов на сцене.
Улучшенная поддержка неродных языков
Одним из ключевых нововведений стала способность новой модели лучше обрабатывать и визуализировать текст на таких языках, как японский, корейский, китайский, хинди и бенгальский. OpenAI отмечает «значительный прогресс» в точности отображения нелатинских символов, что делает инструмент более универсальным для международных пользователей.
Кроме того, модель научилась точнее воспроизводить особенности визуальных стилей разных языков. Это открывает новые возможности для задач, требующих высокой детализации, таких как прототипирование игр и создание раскадровок.
Новые технические возможности
ChatGPT Images 2.0 предлагает расширенные настройки формата изображений: теперь можно генерировать картинки с соотношением сторон от 3:1 (широкий формат) до 1:3 (высокий формат). Также доступно создание изображений с разрешением до 2K и генерация до восьми вариантов за один запрос.
Интеграция с поиском и проверкой фактов
Впервые OpenAI внедрила в модель функции рассуждения, позволяющие ей выполнять поиск в интернете и проверять корректность сгенерированных данных. Это повышает надёжность инструмента в задачах, где важны точность, последовательность и визуальная целостность.
Тестирование новой модели
Перед официальным релизом редакция успела протестировать ChatGPT Images 2.0 на нескольких задачах. В первом тесте модель сгенерировала изображение черепаховой кошки в стиле пиксель-арта третьего поколения игр Pokémon. Результат оказался на высоком уровне, несмотря на сложность задачи — пиксель-арт традиционно плохо поддаётся генерации ИИ.
Во втором тесте модель успешно преобразовала полученное изображение в прозрачный PNG, что не всегда удаётся другим генераторам. В третьем тесте ChatGPT создала четырёхстраничный мангу о кошке, отдыхающей у городского ручья. При этом стиль кошки в манге немного отличался от предыдущего изображения, что может указывать на вариативность генерации.
Сравнение с конкурентами
По словам OpenAI, новая модель превосходит предыдущую версию по точности и детализации. Однако для окончательных выводов о её конкурентоспособности, особенно в сравнении с Google Nano Banana 2, потребуется больше отзывов от пользователей после массового релиза.
Заключение
ChatGPT Images 2.0 — это значительное обновление, которое расширяет возможности генерации изображений, особенно в части работы с неродными языками и сложными визуальными стилями. Новые функции делают инструмент более гибким и точным, что может быть полезно для дизайнеров, разработчиков игр и других специалистов.