«Авито» открыла свои ИИ-модели для рынка e-commerce

Компания «Авито» впервые в России открыла доступ к собственным моделям искусственного интеллекта, обученным на данных электронной коммерции. Разработка, в которую вложено около 500 миллионов рублей, может стать новым инструментом для локальных разработчиков и бизнеса, работающего с онлайн-торговлей.
«Авито» открыла свои ИИ-модели для рынка e-commerce

Авито открыла для участников рынка электронной коммерции доступ к собственным моделям искусственного интеллекта — A-Vibe и A-Vision, сообщил представитель компании. Это первые отечественные опенсорс-решения, заточенные под русский язык и специфику онлайн-торговли в России.

Обучение на реальных данных

Модели тренировались на массивах данных из электронной коммерции — описаниях товаров, каталогах, запросах покупателей. Благодаря этому они способны решать типовые задачи отрасли без долгой адаптации: анализировать документы и таблицы, вытягивать атрибуты из карточек, генерировать описания товаров.

В основе A-Vibe (текстовая) и A-Vision (мультимодальная, работает с текстом и изображениями) лежат модели китайской Alibaba — Qwen3 и Qwen2.5-VL. Каждая насчитывает 8 млрд параметров. Похожие решения на базе китайских технологий ранее публиковали Т-банк и MWS AI, но они не были специализированы под конкретные отрасли.

На разработку Авито потратила около 500 млн руб., включая инфраструктуру, команду и эксперименты, уточнил представитель классифайда.

Длинные тексты и автономные агенты

Обе модели работают с текстами до 32 тыс. токенов — примерно 100 страниц. Они умеют вызывать внешние инструменты для расчетов, поиска в базах данных, обращения к API. Это открывает возможность создания автономных ИИ-агентов — систем, которые не только отвечают на запросы, но и совершают действия с данными.

ХарактеристикаA-VibeA-Vision
СсылкаAvitoTech/avibeAvitoTech/avision
Тип моделиБольшая языковая модель (LLM)Визуально-языковая модель (VLM)
Базовая модельQwen/Qwen3-8B-BaseQwen/Qwen2.5-VL-7B-Instruct
Размер7.9B параметров (BF16)7.4B параметров (BF16)
ОсобенностиАдаптирована для русского языка, поддерживает function calling, решает математические задачиПонимает изображения и текст, описывает фото, OCR, проверка соответствия
Ключевые метрикиmmlu_ru: 0.718 math_500_ru: 0.686 ru_drop: 0.394AvitoImageGen_RU: 0.7668 MMMU_RU: 0.474 RealWorldQA_RU: 0.652
СкоростьНе указана конкретная оптимизация скоростиНа 50% быстрее базовой модели на русском
ИспользованиеЧерез Transformers (текстовая генерация)Через Transformers и qwen_vl_utils (текст + изображения)

Модели уже работают внутри Авито. Теперь их могут использовать другие участники рынка для автоматизации документооборота, генерации контента, создания чат-ботов. Разработчики получают возможность дообучать модели под свои задачи и разворачивать на собственной инфраструктуре. Студенты и преподаватели смогут применять их в образовательных и научных проектах.

Модели доступны на платформе Hugging Face с документацией и примерами. Команда также опубликовала техническую статью с описанием процесса обучения и тестирования.

Снижение порога входа

Управляющий партнер Sk Capital Станислав Колесниченко отмечает, что до этого у российских компаний не было открытых моделей, обученных на русском языке под локальные сценарии e-commerce. Авито — один из немногих игроков с достаточными объемами данных и вычислительными ресурсами для таких решений.

«Это снизит порог входа для стартапов и корпоративных разработчиков, которые смогут создавать продукты на базе готовых моделей, а не адаптировать западные или азиатские системы», 

— считает эксперт.

Среди преимуществ открытых моделей — обученность на российских данных и технологическая независимость. Компании могут разворачивать их на своих серверах, не завися от зарубежных API и санкций. Правда, использование требует развитой инфраструктуры машинного обучения и квалифицированных специалистов, которых на рынке дефицит. Также необходим контур модерации для контроля качества ответов.

Дефицит русскоязычных решений

Гендиректор Dbrain Алексей Хахунов подчеркивает, что на российском рынке сохраняется нехватка открытых языковых моделей на русском языке. Модели крупных игроков — Яндекса и Сбера — привязаны к облачным сервисам. Для банков, медорганизаций и финансовых структур, где данные строго регулируются, отправка информации в облако — крайне чувствительный процесс.

«Развитие опенсорс-моделей, которые можно запускать внутри компаний без передачи данных внешним провайдерам, становится ключевым направлением», 

— говорит Хахунов.

Инвестиция в рынок, а не в прибыль

Колесниченко оценивает сумму в 500 млн руб. как существенную для внутреннего R&D-проекта в России, но несопоставимую с западными и китайскими бюджетами, где на языковые модели тратят миллиарды долларов. Вложения Авито сопоставимы с ранними этапами крупных open-source инициатив вроде Mistral, но с локальной специализацией.

Хахунов добавляет, что по международным меркам инвестиции нельзя назвать крупными — основная часть пошла на оплату труда команды, а не на дорогостоящее обучение. Он называет проект «инвестицией в развитие рынка и бренда», а не коммерческим продуктом — напрямую заработать на публикации открытых моделей вряд ли получится.

Прикладные сценарии

Наибольший потенциал сейчас имеют прикладные задачи — автоматизация повторяющихся процессов, помощь в разработке ПО. Модели такого размера подходят для узких, четко описываемых задач: суммаризация писем, обработка текстов после звонков, автотранскрибация, анализ качества коммуникаций.

Хахунов приводит пример: проверка тональности ответов операторов и соблюдения корпостиля в службах поддержки. Но сложные аналитические задачи, требующие глубокого понимания контекста, — например, оценка бизнес-рисков — таким моделям пока не под силу.

Партнер Data Insight Федор Вирин соглашается: в ритейле ИИ-инструменты применяются для прикладных задач, а не как основа стратегий. Специализированных платформенных решений для отрасли почти нет, поэтому компании используют модели для чат-ботов, систем коммуникации с клиентами, управления контентом и подбора товаров.

Гендиректор «Infoline-аналитики» Михаил Бурмистров отмечает, что специализированные модели наиболее эффективны в генерации карточек товаров, извлечении атрибутов, модерации контента и устранении дубликатов. Когда модель обучена на взаимодействиях продавцов и покупателей, она лучше понимает контекст и структуру каталога, что снижает потребность в ручной настройке.

17:40
228
Нет комментариев. Ваш будет первым!