Серия MiMo-V2.5 от Xiaomi выходит в открытый доступ: 1T параметров с превосходной эффективностью токенов по сравнению с GPT-5.4

Gate News-сообщение, 27 апреля — команда MiMo компании Xiaomi открыла исходный код серии больших языковых моделей MiMo-V2.5 под лицензией MIT, поддерживая коммерческое развертывание, продолженное обучение и донастройку. Обе модели имеют контекстное окно на 1 миллион токенов. MiMo-V2.5-Pro — это модель Mixture-of-Experts по чистому тексту (MoE) с общим числом параметров 1,02 триллиона и 42 миллиардами активных параметров, в то время как MiMo-V2.5 — это нативная мультимодальная модель с общим числом параметров 310 миллиардов и 15 миллиардами активных параметров, поддерживающая понимание текста, изображений, видео и аудио.

MiMo-V2.5-Pro ориентирована на сложные задачи для агентов и программирование. В бенчмарках ClawEval она достигла 64% Pass@3 при потреблении примерно 70 000 токенов на траекторию задачи — на 40%–60% меньше токенов, чем Claude Opus, Gemini 3.1 Pro и GPT-5.4. Модель получила 78,9 балла на SWE-bench Verified. В демонстрации V2.5-Pro самостоятельно реализовала полностью компилятор SysY-to-RISC-V для проекта курса компиляции в Пекинском университете за 4,3 часа, используя 672 обращения к инструментам, добившись идеального результата 233/233 на скрытых тестовых наборах.

MiMo-V2.5 предназначена для сценариев работы мультимодальных агентов и оснащена специализированным vision-энкодером (729 million parameters) и аудио-энкодером (261 million parameters), набирая 62,3 балла на общей подвыборке Claw-Eval. Обе модели используют гибридную архитектуру, сочетающую attention с скользящим окном (SWA) и глобальным attention (GA), дополняемую модулем 3-слойного многотокенного предсказания (MTP) для ускоренного вывода. Веса модели доступны на Hugging Face.

Помимо релиза с открытым исходным кодом, команда MiMo запустила программу поощрения «Orbit Quadrillion Token Creator Incentive Program», предлагая 100 квадриллионов токенов бесплатно в течение 30 дней глобальным пользователям. Отдельные разработчики, команды и предприятия могут подать заявку через страницу программы, при этом цикл оценки составляет примерно 3 рабочих дня; одобренные выгоды распределяются как Token Plans или прямые зачисления, совместимые с такими инструментами, как Claude Code и Cursor.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

ASML увеличивает производство EUV на 36% по мере роста спроса на AI ЦОД

Производитель оборудования для производства чипов из Нидерландов ASML планирует увеличить выпуск машин для литографии в глубоком ультрафиолете (EUV) примерно на 36% в 2026 году, чему способствует рост спроса со стороны расширения AI дата-центров, согласно последним прогнозам компании. ASML стремится произвести как минимум 60 стандартных систем EUV i

CryptoFrontier18м назад

OpenAI не дотягивает до целей по росту пользователей и продажам, повышая обеспокоенность по поводу расходов на ИИ-инфраструктуру

Новостное сообщение Gate News, 28 апреля — Согласно The Wall Street Journal, OpenAI не смогла выполнить свои внутренние целевые показатели по привлечению новых пользователей и росту продаж, что вызвало опасения внутри компании относительно ее способности поддерживать масштабные расходы на

GateNews19м назад

Microsoft развертывает Copilot для 743 000 сотрудников Accenture

Согласно Reuters, Microsoft развертывает Microsoft 365 Copilot для всех 743 000 сотрудников Accenture, отмечая его крупнейшее корпоративное развертывание на сегодняшний день. Этот шаг расширяет план Accenture на 2024 год по предоставлению Copilot до 300 000 сотрудников. Опрос Accenture

CryptoFrontier1ч назад

DeepSeek увеличивает уставный капитал на 50%, доля основателя Ляна Вэньфэна растет до 34%

Сообщение Gate News, 28 апреля — Согласно данным Qichacha, DeepSeek (Hangzhou Deepseek AI Basic Technology Research Co., Ltd.) увеличила свой уставный капитал с 10 млн юаней до 15 млн юаней. Вклад основателя Ляна Вэньфэна в уставный капитал вырос с 1 млн юаней до 5,1 млн юаней

GateNews1ч назад

Мета-резервы: 1 ГВт+ солнечной энергии и накопителей для ЦОДов ИИ

Meta заключила энергосделки с Overview Energy и Noon Energy, чтобы зарезервировать мощность для своих центров обработки данных искусственного интеллекта, согласно The Economic Times. Компания зарезервировала до 1 гигаватта

CryptoFrontier1ч назад

Zhipu Z.ai продлевает акцию с тройным лимитом GLM Coding Plan до 30 июня

Gate News сообщение от 28 апреля — Zhipu Z.ai объявила о продлении своей акции с тройным лимитом по GLM Coding Plan с первоначального дедлайна 30 апреля до 30 июня, охватывая модели GLM-5.1 и GLM-5-Turbo. Акция доступна по восточному времени с 6:00 до 2:00 следующего дня. GLM Coding

GateNews1ч назад
комментарий
0/400
Нет комментариев