OpenAI выпустила GPT-5.5 — новую флагманскую модель, которая стала лучше предыдущих в программировании, работе с компьютером и выполнении многоступенчатых рабочих задач. Это первая полностью переобученная базовая модель OpenAI со времен GPT-4.5 — до этого компания почти год дорабатывала существующую архитектуру.

Главное отличие GPT-5.5 — модель теперь может сама планировать работу, пользоваться инструментами и доводить сложные многоступенчатые задачи до конца. Пользователю будет достаточно поставить задачу в общих чертах — GPT-5.5 сама решит, как разбить ее на шаги, какие инструменты применить и когда проверить результат.

На ключевом тесте автономного программирования Terminal-Bench 2.0 модель набрала 82,7% — это рекорд среди всех существующих моделей. На SWE-Bench Pro, где ИИ решает реальные задачи из GitHub, — 58,6%. Это выше недавно вышедших Claude Opus 4.7 (53,4%) и Kimi K2.6 (58,6% на равных). На тесте GDPval, который проверяет, как ИИ справляется с типовой работой в 44 профессиях, GPT-5.5 взяла 84,9%. На OSWorld-Verified, где модель самостоятельно управляет реальным компьютером, — 78,7%. На Tau2-bench Telecom, который моделирует работу службы поддержки, — 98%.

Внутри OpenAI модель уже участвовала в улучшении собственной инфраструктуры. Команда подключила Codex к анализу продакшн-трафика — и GPT-5.5 написала алгоритмы, которые оптимизировали распределение запросов между GPU. Проще говоря, модель помогла улучшить систему, которая ее же и обслуживает.

Подписчикам Plus, Pro, Business и Enterprise в ChatGPT и Codex модель будет доступна уже сегодня. Pro-версия — только тарифам Pro, Business и Enterprise. Для API разработчикам придется подождать — OpenAI готовит отдельные меры безопасности для публичного запуска.

В API стандартная GPT-5.5 будет стоить 5 долларов за миллион входных токенов и 30 за миллион выходных — против 2,5/15 у GPT-5.4. Pro-версия — 30/180. При этом OpenAI утверждает, что модель расходует токены экономнее: в Codex GPT-5.5 будет выдавать более качественный результат меньшим числом токенов, чем предыдущая версия.

Источник: OpenAI

Поделиться ВКонтакте Telegram