Microsoft выпустила 7 AI-моделей Build: использование токенов на 60% меньше, чем у конкурентов

微軟Build AI模型

Microsoft(«Майкрософт») на конференции Build в июне объявила о выпуске 7 новых ИИ-моделей, охватывающих области рассуждений, кода, изображений, транскрипции и речи. В 4 ключевых тестах на программирование MAI-Code-1-Flash показал превосходство над Claude Haiku 4.5, а в SWE-Bench Verified использование токенов снизилось максимум на 60%.

Список из 7 моделей: полное покрытие по пяти ключевым направлениям

На Build-конференции Microsoft были опубликованы полные названия 6 моделей: MAI Thinking-1 (рассуждения), MAI Code-1-Flash (код), MAI Image-2.5 (изображения), MAI Image-2.5-Flash (сжатая версия изображений), MAI Transcribe-1.5 (транскрипция) и одна речевая модель; полное название 7-й модели в текущих публикациях раскрыто не полностью. Microsoft заявила, что флагманская модель рассуждений MAI-Thinking-1 демонстрирует конкурентоспособность по задачам STEM-рассуждений и кодирования по сравнению с аналогичными моделями, но не привела конкретных данных по бенчмаркам.

MAI-Code-1-Flash vs Claude Haiku 4.5: данные по 4 бенчмаркам

MAI-Code-1-Flash в следующих 4 бенчмарках имеет более высокий проходной процент, чем Claude Haiku 4.5, при этом использует меньше токенов:

SWE-Bench Pro:MAI-Code-1-Flash 51,2% vs Claude Haiku 4.5 35,2%,опережение на 16 баллов

SWE-Bench Verified:количество токенов для решения сложных задач снижено максимум на 60%

IF Bench(точное отслеживание инструкций):MAI-Code-1-Flash опережает на 28,9 балла

Advanced IF:MAI-Code-1-Flash опережает на 14,5 балла

Официальная документация Microsoft указывает, что точность MAI-Code-1-Flash в ключевых противодействующих категориях, включая ловушки Einstellung, по-прежнему ниже 50%, что относится к уже выявленным возможностям для улучшения.

Текущая доступность MAI-Code-1-Flash: для частных пользователей без допнастроек

MAI-Code-1-Flash уже развернут в версии VS Code GitHub Copilot для частных пользователей. Его можно использовать напрямую через селектор модели или автоматически маршрутизировать через Copilot с помощью автоселектора. Модель использует адаптивное управление длиной при генерации: для простых запросов ответ остается лаконичным, а для сложных задач задействуется больше вычислительных ресурсов на рассуждения. Сроки выпуска корпоративной версии и развертывания для других групп пользователей пока не объявлены.

Часто задаваемые вопросы

Какие 7 новых моделей были опубликованы Microsoft в Build 2026?

В числе моделей с раскрытыми полными названиями: MAI Thinking-1, MAI Code-1-Flash, MAI Image-2.5, MAI Image-2.5-Flash, MAI Transcribe-1.5 и одна речевая модель — всего 6; полное название 7-й модели в текущих официальных материалах раскрыто не полностью.

Как реализовано снижение токенов на 60% у MAI-Code-1-Flash?

Microsoft заявляет, что модель обучена с адаптивным контролем длины ответа, который автоматически регулирует глубину рассуждений в зависимости от сложности задачи. Результаты тестов Microsoft в SWE-Bench Verified показывают, что при решении сложных проблем использование токенов может быть снижено максимум на 60%.

Для каких пользователей MAI-Code-1-Flash открыт сейчас и каков график корпоративной версии?

По состоянию на июнь 2026 года MAI-Code-1-Flash доступен для частных пользователей VS Code GitHub Copilot и не требует дополнительных настроек. Microsoft пока не объявила сроки развертывания корпоративной версии или для других групп пользователей.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев