Google представила Gemini 3.1 Flash-Lite - быструю и недорогую ИИ-модель для массовых задач

Google представила новую модель Gemini 3.1 Flash-Lite - самую быструю и доступную в линейке Gemini 3. Она ориентирована на массовые задачи вроде перевода, классификации данных и работы с мультимодальным контентом. Разработчики смогут использовать модель уже сейчас через Gemini API и инфраструктуру Vertex AI.
Google представила Gemini 3.1 Flash-Lite - быструю и недорогую ИИ-модель для массовых задач

Корпорация Google объявила о выпуске Gemini 3.1 Flash-Lite - новой мультимодальной модели искусственного интеллекта, ориентированной на высоконагруженные сервисы и приложения, где важны скорость ответа и стоимость вычислений. Модель стала частью семейства Gemini 3 и уже доступна в режиме предварительного тестирования через Gemini API в Google AI Studio и корпоративную платформу Vertex AI.

Разработчики смогут использовать её для масштабируемых задач - например, перевода текстов, классификации данных, анализа изображений и выполнения сложных логических запросов. Стоимость работы модели составляет около 0,25 доллара за миллион входных токенов (примерно 23 рубля) и 1,5 доллара за миллион выходных токенов (около 140 рублей), что делает её одной из самых доступных моделей в линейке Google.

скорость и цены

Скорость и производительность

Gemini 3.1 Flash-Lite стала заметно быстрее предыдущих версий. По данным Google, скорость генерации ответов выросла примерно на 45 % по сравнению с моделью Gemini 2.5 Flash. Кроме того, время появления первого токена - важный показатель для интерактивных сервисов - сократилось примерно в 2,5 раза.

В тестах модель демонстрирует высокие показатели. Например, в сложном бенчмарке GPQA Diamond, который проверяет способность ИИ рассуждать над научными задачами, она получила результат 86,9 %. В системе рейтингов Elo, используемой для оценки «общего интеллекта» моделей, её показатель составил 1432.

бенчмарк

По ряду метрик, включая скорость, точность фактов и качество ответов, Flash-Lite опережает некоторые компактные модели конкурентов, включая GPT-5 mini и Claude 4.5 Haiku.

Управляемая «глубина мышления»

Одной из заметных особенностей новой модели стала возможность регулировать уровень вычислений. Разработчики могут выбирать уровень «мышления» - низкий, средний или высокий.

Это позволяет гибко управлять ресурсами. Для простых задач вроде извлечения данных или генерации коротких ответов можно использовать минимальный уровень рассуждений. А для сложных сценариев - например, построения пользовательских интерфейсов или анализа длинных инструкций - включать более глубокий режим обработки.

Такая настройка помогает балансировать между стоимостью работы модели и качеством результата.

Мультимодальные возможности

Gemini 3.1 Flash-Lite изначально создавалась как мультимодальная система. Она способна работать сразу с несколькими типами данных: текстом, изображениями, видео и аудио.

В тестах модель показывает уверенные результаты в различных задачах. Среди них:

  • MMMU-Pro - анализ изображений и визуальных задач
  • Video-MMMU - понимание видеоконтента
  • Multilingual MMLU - проверка знаний на нескольких языках

По данным Google, база знаний модели охватывает информацию до января 2025 года.

Безопасность и тестирование

В технической документации Google отмечает, что модель прошла серию проверок на безопасность. В частности, она соответствует требованиям по защите детей и соблюдению этических стандартов.

Flash-Lite тестировали по нескольким направлениям: скорость работы, логическое рассуждение, точность фактов, использование инструментов агентного типа, программирование и обработка длинного контекста.

Часть независимых тестов проводилась аналитическими площадками вроде Artificial Analysis.

Реакция разработчиков

После анонса модель активно обсуждается в профессиональном сообществе. Разработчики отмечают её высокую скорость и пригодность для реальных сервисов.

Некоторые пользователи уже протестировали модель на задачах анализа видео. По их словам, ответы появляются значительно быстрее, чем у предыдущих поколений Gemini.

«Главное достоинство - экономика. Если модель достаточно хороша и при этом дешёвая, её можно использовать в массовых продуктах»,

- отмечают разработчики в обсуждениях.

В то же время ранние тестировщики обращают внимание на типичную для больших языковых моделей проблему - периодические «галлюцинации», когда система уверенно выдаёт неточную информацию. Хотя, по мнению некоторых пользователей, новая версия лучше следует инструкциям по сравнению с ранними моделями Gemini.

Контекст запуска

Появление Flash-Lite произошло спустя несколько недель после релиза Gemini 3.1 Pro - более мощной версии модели. Таким образом Google формирует многоуровневую линейку: от компактных и быстрых решений до моделей для сложных вычислений.

Пока Gemini 3.1 Flash-Lite доступна только в режиме preview под кодовым именем gemini-3.1-flash-lite-preview. Точная дата полноценного релиза пока не объявлена.

Однако сторонние сервисы уже начинают интеграцию. Например, платформа Netlify добавила поддержку модели через AI Gateway, что позволяет разработчикам вызывать её без прямой настройки API-ключей.

Что это значит для рынка

На фоне стремительного роста индустрии ИИ всё больше внимания уделяется не только мощности моделей, но и их стоимости в эксплуатации.

Gemini 3.1 Flash-Lite отражает именно этот тренд - переход от «самых больших моделей» к решениям, которые можно массово внедрять в реальные сервисы и продукты.

Для разработчиков это означает более низкий порог входа при создании приложений с ИИ. Для бизнеса - возможность снижать расходы на автоматизацию обработки данных, поддержку пользователей и аналитические задачи.

07:35
192
Google
Google — это глобальная технологическая компания, основанная 4 сентября 1998 года Ларри Пейджем и Сергеем Брином в Калифорнии.
Нет комментариев. Ваш будет первым!