Mercury 2 от Inception Labs набрала 90% на AIME 2026 и обогнала DiffusionGemma от Google

В четверг (18 июня) Inception Labs представила Mercury 2, позиционировав его как самый быстрый в мире модель рассуждений, которая генерирует примерно 1 000 токенов в секунду. Согласно заявлению компании, Mercury 2 показала 90% на AIME 2026 (задачах American Invitational Mathematics Examination) по сравнению с DiffusionGemma от Google — 69,1% на этом же бенчмарке. Модель также достигла 77% на GPQA, научном бенчмарке уровня PhD. Augment Code, компания по разработке AI-агентов, сообщила о снижении задержки на 82% и сокращении расходов на 90% после замены Mercury 2 на Claude Opus 4.7 от Anthropic при сохранении качества выходных данных.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев