Google DeepMind выпускает Gemma 4 12B — мультимодальную модель с открытым исходным кодом, работающую на видеопамяти 16 ГБ

Google DeepMind сегодня выпустила Gemma 4 12B — открытый мультимодальный ИИ-модель. Модель с 12 миллиардами параметров обеспечивает производительность на уровне более крупной модели 26B Mixture of Experts, при этом требует менее половины памяти, и может запускаться на ноутбуках для потребителей с объемом VRAM всего 16 ГБ, включая устройства начального уровня MacBook Air M5.

Gemma 4 12B — это первая модель среднего размера в серии Gemma 4, поддерживающая нативный аудиоввод. Модель использует облегченную архитектуру без отдельных vision- и audio-энкодеров, что обеспечивает более низкую задержку и меньшее потребление памяти. Она поддерживает многошаговое рассуждение, сценарии Agent и полностью офлайн локальный инференс. Модель выпущена под лицензией Apache 2.0, а предобученные веса доступны на Hugging Face и Kaggle. Также ее можно развертывать через платформы Google Cloud, включая Model Garden, Cloud Run и GKE.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев