По данным Beating, Google Gemini 3.1 Flash-Lite перешёл из режима предпросмотра в общую доступность (GA) 8 мая, став самым дешёвым и быстрым в серии Gemini 3. Стоимость ввода установлена на уровне $0,25 за миллион токенов, а вывода — $1,50 за миллион токенов: ввод на 75% дешевле, чем у Claude 4.5 Haiku ($1,00), а вывод — на 70% дешевле ($5,00). Модель поддерживает контекстное окно в 1 миллион токенов и достигает пропускной способности 363 токена в секунду — на 45% быстрее, чем её предшественник Gemini 2.5 Flash.

Бенчмарки производительности показывают GPQA Diamond (рассуждения на уровне аспирантуры по науке) на уровне 86,9%, что выше Claude 4.5 Haiku (73,0%) и GPT-5 mini (82,3%). MMMU-Pro (мультимодальное рассуждение) достигает 76,8%. Среди ранних пользователей — платформа для клиентской поддержки Gladly, которая сообщает о снижении затрат на 60% и 99,6% успешности на рабочих нагрузках в продакшене, а также JetBrains, интегрировавшая Flash-Lite в инструменты IDE для помощи пользователям.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

05-08 00:08

OpenAI запускает модель GPT-5.5-Cyber и фреймворк Trusted Access для защитников кибербезопасности

05-07 08:11

Snap завершает сделку с Perplexity AI и отменяет выплату в размере 400 миллионов долларов

05-07 04:21

Google и Naver переводят рекламу в push в инструменты AI-поиска; выручка Naver за 1-й квартал растёт на 16,3% до 2,22 млрд долларов

05-07 02:04

Рост пользователей Gemini и Claude ускоряется в апреле, тогда как рост ChatGPT замедляется до 30% год к году

05-06 07:57

SenseNova U1 снижает затраты на генерацию изображений до одной десятой от изображений ChatGPT 2.0, SenseTime публикует первую прибыльную половину в 2025 году

Детальный анализ