Claude выпустили свою новую флагманскую модель

Anthropic выпустила Claude Opus 4.7 — новую флагманскую модель с серьезным скачком в написании кода. Одновременно компания впервые целенаправленно ослабила у модели способности, связанные с кибербезопасностью.

На тесте SWE-bench Pro, который проверяет умение модели писать код в автономном режиме, Opus 4.7 набрала 64,3% против 53,4% у предыдущей версии Opus 4.6. Это также выше результата GPT-5.4 от OpenAI (57,7%). Впереди остается только собственная топовая модель Anthropic — Claude Mythos Preview с 77,8%, — но она не выпущена в открытый доступ из соображений безопасности.

Модель будет буквальнее следовать инструкциям. Anthropic предупредила: промпты, которые работали на Opus 4.6, могут выдавать неожиданные результаты, потому что старая модель часто «додумывала» и пропускала части задания, а новая выполняет ровно то, что написано.

Также Opus 4.7 теперь обрабатывает изображения втрое выше разрешением — до 3,75 мегапикселя. Это особенно поможет ИИ-агентам, которые работают с интерфейсом компьютера по скриншотам, и тем, кто извлекает данные из сложных диаграмм. На тесте OfficeQA Pro по работе с документами точность выросла с 57,1% до 80,6%.

Самое необычное в релизе — как Anthropic работает с кибербезопасностью. Компания экспериментально попыталась снизить способности модели, связанные с кибератаками, прямо во время обучения. Запросы, которые могут быть использованы во вредных целях, будут автоматически блокироваться. Это часть более широкой стратегии: на прошлой неделе Anthropic запустила Project Glasswing — программу, в которой самая мощная модель Mythos Preview остается закрытой, а новые защитные механизмы сначала тестируют на Opus 4.7. Специалистам по безопасности, которым нужен доступ для легальных задач — пентестов и редтиминга, — компания предлагает отдельную программу верификации.

Цены на токены остались прежними — 5 долларов за миллион входных и 25 за миллион выходных. Но Anthropic сменила токенизатор: тот же текст теперь будет превращаться в 1,35 раза больше токенов. То есть по факту один и тот же запрос обойдется дороже. Для пользователей Claude Code добавилась команда /ultrareview для детальной проверки кода и расширенный автоматический режим для подписки Max. Новая модель доступна через Claude API, Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry.

Источник: Anthropic

Anthropic выпустила новую флагманскую модель Claude Opus 4.7