Призвана победить Opus: вышла Sonnet 5

Anthropic представила Claude Sonnet 5 — новую модель Claude для задач, где ИИ должен сам составлять план, пользоваться инструментами и доводить работу до результата. До 31 августа разработчики смогут подключать ее по вводной цене $2 за миллион входных токенов и $10 за миллион выходных. После 31 августа цена вырастет до $3 за миллион входных токенов и $15 за миллион выходных.

В последних релизах самые сложные задачи с кодом, браузером и терминалом лучше решали более дорогие модели Opus. Sonnet 5 должна сократить этот разрыв: Anthropic пишет, что новая модель близка к Opus 4.8 по качеству, но стоит дешевле.

Пользователи уже могут выбрать Claude Sonnet 5 во всех тарифах Claude. Для Free и Pro она стала моделью по умолчанию, а в Max, Team и Enterprise ее добавили как доступный вариант.

В Terminal-Bench 2.1, который проверяет работу с задачами в терминале, Sonnet 5 получила 80,4% против 67,0% у Sonnet 4.6 и 82,7% у Opus 4.8. В SWE-bench Pro, тесте по программированию, результат составил 63,2% против 58,1% и 69,2%.

sonnet

Также по оценке Anthropic, Sonnet 5 реже дает нежелательные ответы, чем Sonnet 4.6, и лучше сопротивляется попыткам обмануть инструкцию. Для опасных киберзадач модель получила защитные фильтры по умолчанию, а для профессиональной работы в кибербезопасности с меньшими ограничениями Anthropic рекомендует Opus 4.8.

Источник: Anthropic

0 Комментарий

Anthropic запустила Claude Sonnet 5