Google запустила два новых тарифа в Gemini API — Flex и Priority. Flex обойдется разработчикам вдвое дешевле стандартного тарифа, а Priority будет стоить на 80% дороже, но будет стабильно работать при пиковых нагрузках на серверы.
До этого разработчики, которые хотели сэкономить на запросах к моделям Gemini, пользовались Batch API — отдельным интерфейсом для пакетной обработки. Он требовал отправлять файлы, ждать результатов и проверять статус задач. Flex решил ту же проблему проще: разработчик сможет отправлять запросы как обычно, но ответ будет приходить с задержкой — Google задействует свободные серверные мощности в непиковое время.
Одновременно с эти Google обновила цены для всех моделей. Для Gemini 3 Pro на стандартном тарифе миллион входных токенов стоил $2, миллион выходных — $12. На Flex те же объемы обойдутся в $1 и $6. На Priority — в $3,60 и $21,60. Для более легкой Gemini 3 Flash-Lite входные токены на Flex будут стоить $0,05 за миллион — в 20 раз дешевле, чем Gemini 3 Pro на стандартном тарифе.
Также Google посоветовала использовать тарифы в зависимости от задач. Flex — для фоновых процессов: массовой обработки данных, исследований, автоматических сценариев, где скорость ответа не критична. Priority — для продуктов с пользователями в реальном времени: чат-ботов, модерации контента, срочных запросов. Если трафик превысит лимит Priority, запросы автоматически перейдут на стандартный тариф и не будут отклонены.
Оба тарифа стали доступны для моделей семейства Gemini 3, Gemini 2.5 Pro и Flash.
Источник: Google Blog