Китайская компания Zhipu AI выпустила GLM-5.1 — открытую ИИ-модель для программирования, которая умеет самостоятельно менять стратегию решения, если заходит в тупик. На тесте SWE-Bench Pro модель набрала 58,4% — больше, чем GPT-5.4 (57,7%) и Claude Opus 4.6 (57,3%).
Существующие модели, включая предыдущую GLM-5, решают задачи по программированию по одной стратегии. Они быстро продвигаются на первых шагах, но затем упираются в потолок: повторяют одни и те же приемы и не могут выбраться из тупика. Увеличение вычислительных ресурсов не помогает — модели просто повторяют свои ошибки. GLM-5.1 построена иначе: она периодически пересматривает свой подход и меняет его, если прогресс остановился.
Zhipu AI показала это на задаче оптимизации векторной базы данных — системы, которая ищет похожие записи в больших массивах данных. Цель — обработать как можно больше запросов в секунду без потери точности. В стандартном тесте из 50 попыток лучший результат принадлежал Claude Opus 4.6 — 3 547 запросов в секунду. GLM-5.1 получила неограниченное число попыток и за более чем 600 итераций достигла 21 500 запросов в секунду — в шесть раз больше. По данным Zhipu AI, модель шесть раз кардинально сменила подход: около 90-й итерации перешла от полного перебора данных к группировке, а около 240-й добавила двухступенчатую фильтрацию — сначала грубую, потом точную.
На задаче ускорения кода для видеокарт GLM-5.1 добилась ускорения в 3,6 раза, но Claude Opus 4.6 оказался впереди с результатом 4,2 раза. В третьем тесте модель за восемь часов работы без промежуточных инструкций собрала полноценное окружение рабочего стола Linux в виде веб-приложения — с файловым менеджером, терминалом, текстовым редактором и калькулятором.
При этом в задачах на рассуждение и знания GLM-5.1 заметно отстает. На тесте Humanity's Last Exam она набрала 31% против 45% у Gemini 3.1 Pro и 39,8% у GPT-5.4. На научных вопросах (GPQA-Diamond) — 86,2% против 94,3% у Gemini 3.1 Pro.
GLM-5.1 доступна на Hugging Face, работает с инструментами для разработки Claude Code и OpenClaw.
Источник: Zhipu AI