Google DeepMind сегодня выпустила Gemma 4 12B — открытый мультимодальный ИИ-модель. Модель с 12 миллиардами параметров обеспечивает производительность на уровне более крупной модели 26B Mixture of Experts, при этом требует менее половины памяти, и может запускаться на ноутбуках для потребителей с объемом VRAM всего 16 ГБ, включая устройства начального уровня MacBook Air M5.
Gemma 4 12B — это первая модель среднего размера в серии Gemma 4, поддерживающая нативный аудиоввод. Модель использует облегченную архитектуру без отдельных vision- и audio-энкодеров, что обеспечивает более низкую задержку и меньшее потребление памяти. Она поддерживает многошаговое рассуждение, сценарии Agent и полностью офлайн локальный инференс. Модель выпущена под лицензией Apache 2.0, а предобученные веса доступны на Hugging Face и Kaggle. Также ее можно развертывать через платформы Google Cloud, включая Model Garden, Cloud Run и GKE.