Microsoft AI представила модели для работы с текстом, программным кодом, изображениями, синтезом и расшифровкой речи и предложила компаниям дообучать их на собственных рабочих данных. По внутренним тестам Microsoft, настроенная под Excel версия сравнялась по качеству с GPT-5.4, но обошлась в десять раз дешевле.
Главная модель семейства, MAI-Thinking-1, отвечает за сложные рассуждения и, по замерам компании, не уступает сильнейшим конкурентам в программировании. Модель для расшифровки аудио понимает 43 языка и работает, как уверяет Microsoft, впятеро быстрее соперников. Модель синтеза речи озвучивает текст на 15 языках и умеет скопировать голос по короткому образцу — у части моделей есть и облегченные, более дешевые версии.
Самое важное для Microsoft — не сами модели, а возможность настроить их под отдельную компанию. Подход, который в Microsoft называют Frontier Tuning, позволяет обучать модель на том, как сотрудники реально решают задачи: на их шагах, решениях и действиях внутри организации. Эти данные остаются у компании и не уходят на сторону.
Источник: Microsoft AI