Новый флагман от OpenAI: что умеет GPT-5.5

Компания OpenAI анонсировала выпуск GPT-5.5 — самой производительной на сегодняшний день модели, способной решать сложные задачи в области программирования, научных исследований и автоматизации рабочих процессов. По заявлению разработчиков, новая система значительно превосходит предыдущие версии по точности, автономности и возможностям взаимодействия с инструментами.

Рекордные результаты на ключевых тестах

GPT-5.5 демонстрирует выдающиеся результаты на ведущих бенчмарках:

  • Terminal-Bench 2.0 (оценка сложных командных рабочих процессов): 82,7% — на 7,6 процентных пункта выше, чем у GPT-5.4 (75,1%).
  • OSWorld-Verified (проверка возможности автономного управления компьютером): 78,7% против 75% у GPT-5.4.
  • SWE-Bench Pro (разрешение реальных задач из GitHub): 58,6% решений за один проход — лучший результат среди аналогичных моделей.

Для сравнения, у конкурентов показатели ниже: Anthropic Opus 4.7 набирает 69,4% на Terminal-Bench и 78% на OSWorld-Verified, а Google Gemini 3.1 Pro — 68,5% и 68,5% соответственно.

Улучшенные возможности кодинга и научных исследований

Новая модель позиционируется как самый мощный агент для программирования. Она способна:

  • Генерировать чистый и структурированный код, сравнимый по качеству с работой опытного инженера.
  • Анализировать архитектуру программных систем, выявлять причины ошибок и предлагать точные исправления.
  • Проводить научные исследования, включая генерацию гипотез и их проверку.
  • Выполнять многоэтапные задачи на компьютере без вмешательства человека.

По словам генерального директора OpenAI Грега Брокмана, GPT-5.5 позволит кодинг-агенту Codex работать с уровнем суждения, сопоставимым с профессиональным разработчиком. На данный момент Codex используют около 4 миллионов разработчиков еженедельно.

Конкуренция и темпы развития

Выход GPT-5.5 состоялся всего через несколько недель после релиза GPT-5.4, что подчеркивает ускоряющиеся темпы развития ИИ. OpenAI стремится сохранить лидерство в гонке с Anthropic и другими конкурентами, особенно в сегменте инструментов для программирования — одной из самых востребованных областей применения ИИ в бизнесе.

Некоторые эксперты предполагают, что GPT-5.5 может содержать до 10 триллионов параметров, однако Брокман отказался подтверждать эту информацию.

Доступность и тарифы

Новая модель уже доступна пользователям подписок ChatGPT Plus, Pro, Business и Enterprise. Для корпоративных клиентов и пользователей тарифа Pro доступна также GPT-5.5 Pro — версия с повышенной точностью.

Перспективы развития

Эксперты отмечают, что GPT-5.5 знаменует собой новый этап в развитии автономных ИИ-систем. Возможность выполнения сложных задач без постоянного контроля человека открывает перспективы для автоматизации не только рутинных, но и креативных процессов в науке, разработке и управлении.

Источник: Fast Company