Microsoft представила семь новых моделей ИИ на ежегодном мероприятии Build во вторник, заявив, что они превзошли Claude Sonnet 4.6 от Anthropic и Nano Banana 2 от Google в слепых тестах и бенчмарках по редактированию изображений. Запуск отражает стремление Microsoft утвердиться в качестве разработчика «фронтирного» ИИ, а не только крупнейшего партнера OpenAI по поддержке и инфраструктуре. Объявление прозвучало на фоне усиления конкуренции среди ведущих разработчиков ИИ: недавно Anthropic и Google выпустили собственные флагманские модели.
MAI-Thinking-1 обходит Claude Sonnet 4.6 в слепых тестах
MAI-Thinking-1 — флагманская текстовая фундаментальная модель Microsoft — по данным CEO Microsoft AI Мустафы Сулеймана была предпочтена Claude Sonnet 4.6 Anthropic в слепых тестах, проведенных независимыми оценщиками. Модель набрала 97% на AIME 2025 — бенчмарке, измеряющем продвинутые навыки решения задач и рассуждений. Сулейман заявил, что результат MAI на SWE Bench Pro ставит её «прямо рядом с Opus 4.6 на одном из самых сложных бенчмарков по кодингу». Microsoft также утверждала, что MAI «обеспечила самый высокий процент побед, обойдя GPT-5.5 по качеству, при этом она в 10 раз дешевле».
«Супер рад(а) объявить сегодня о семи новых моделях мирового класса MAI», — написал Сулейман в X. «Они отражают то, что мы считаем новым этапом в ИИ — этапом, который поможет вам сохранять контроль и оставаться на переднем крае».
Microsoft запускает еще шесть моделей ИИ в категориях кодинга, изображений, голоса
Microsoft представила MAI-Code-1-Flash — легковесную модель для GitHub Copilot и Visual Studio Code. Компания также раскрыла MAI-Image-2.5 и его Flash-версию, которые, по словам Microsoft, превосходят Nano Banana Pro от Google в задачах по редактированию изображений. Кроме того, были объявлены MAI Transcribe-1.5 — модель для транскрипции, поддерживающая 43 языка, и MAI-Voice-2 — модель генерации речи, способная воспроизводить голоса с естественным звучанием на 15 языках и адаптироваться к говорящему по короткому аудиофрагменту.
«Это чрезвычайное время для технологий. Вычислительные ресурсы, используемые для обучения фронтирных моделей, выросли в миллиард раз», — сказал Сулейман в блоге, где анонсированы новые модели. «Теперь мы ожидаем еще десятикратное увеличение в течение следующих трех лет, что, в свою очередь, означает больше продвинутых возможностей и дальнейшее развертывание все более эффективного ИИ».
Anthropic и Google выпускают конкурирующие модели
На прошлой неделе Anthropic объявила о запуске Opus 4.8, который, по словам компании, быстрее и умнее в тестах по бенчмаркам и включает новые функции. Во вторник Anthropic сообщила о расширении своего Project Glasswing, предоставив 150 компаниям доступ к ориентированной на кибербезопасность модели Mythos. На Google I/O в мае Google представила Gemini Omni — мультимодальную ИИ-модель, объединяющую Gemini с Veo, Nano Banana и моделями генерации медиа Genie, а также Gemini Spark — облачного ИИ-агента, предназначенного для управления задачами между приложениями и рабочими процессами.
«Разработчики и бизнесы просили ИИ, который работает на ваших условиях и по вашим правилам», — написал Сулейман. «Мы рассматриваем это как важный шаг на пути к реализации этого».
FAQ
Что Microsoft объявила на мероприятии Build во вторник?
Microsoft представила семь новых моделей ИИ, включая MAI-Thinking-1, MAI-Code-1-Flash, MAI-Image-2.5, MAI Transcribe-1.5 и MAI-Voice-2, заявив, что они превзошли Claude Sonnet 4.6 от Anthropic и Nano Banana 2 от Google в различных бенчмарках.
Как MAI-Thinking-1 показала себя в бенчмарках?
MAI-Thinking-1 набрала 97% на AIME 2025 и, по данным CEO Microsoft AI Мустафы Сулеймана, была предпочтена Claude Sonnet 4.6 в слепых тестах, проведенных независимыми оценщиками.