NVIDIA представляет Mistral-NeMo-Minitron 8B: компактная языковая модель

NVIDIA бросает вызов гигантам ИИ, представляя миниатюрную языковую модель с точностью мирового класса. Новая разработка обещает революцию в мире генеративного ИИ, делая передовые технологии доступными даже для небольших устройств.
NVIDIA представляет Mistral-NeMo-Minitron 8B: компактная языковая модель

Компания NVIDIA представила новую языковую модель Mistral-NeMo-Minitron 8B, которая совмещает в себе высокую точность и компактные размеры. Эта модель является уменьшенной версией недавно выпущенной Mistral NeMo 12B и способна работать на рабочих станциях, оснащенных графическими процессорами NVIDIA RTX.

Брайан Катанзаро, вице-президент по исследованиям в области прикладного глубокого обучения NVIDIA, пояснил: "Мы объединили два метода оптимизации ИИ — обрезку для сокращения 12 миллиардов параметров Mistral NeMo до 8 миллиардов, и дистилляцию для повышения точности. В результате Mistral-NeMo-Minitron 8B обеспечивает сопоставимую точность с оригинальной моделью при меньших вычислительных затратах".

Mistral-NeMo-Minitron 8B лидирует по девяти популярным тестам для языковых моделей в своем классе. Эти тесты охватывают различные задачи, включая понимание языка, здравый смысл, математические рассуждения, суммаризацию, кодирование и способность генерировать правдивые ответы.

Компактные языковые модели могут работать в режиме реального времени на рабочих станциях и ноутбуках. Это упрощает развертывание возможностей генеративного ИИ в организациях с ограниченными ресурсами, оптимизируя затраты, операционную эффективность и энергопотребление. Локальный запуск языковых моделей на периферийных устройствах также повышает безопасность, так как данные не нужно передавать на сервер.

Разработчики могут начать работу с Mistral-NeMo-Minitron 8B, используя ее в качестве микросервиса NVIDIA NIM со стандартным API, или загрузить модель с платформы Hugging Face.

NVIDIA также объявила о выпуске Nemotron-Mini-4B-Instruct — еще одной компактной языковой модели, оптимизированной для низкого использования памяти и более быстрого времени отклика на ПК и ноутбуках с NVIDIA GeForce RTX AI.

Эти разработки NVIDIA открывают новые возможности для внедрения технологий ИИ в различные устройства и приложения, делая передовые языковые модели доступными для более широкого круга пользователей и разработчиков.

19:58
75
NVIDIA
NVIDIA Corporation одна из ведущих технологических компаний в мире, известная своими инновациями в области графических процессоров и технологий искусственного интеллекта.
Mistral AI Ltd
Mistral AI Ltd. — французская компания, специализирующаяся на разработке и внедрении решений в области искусственного интеллекта.
Нет комментариев. Ваш будет первым!
Посещая этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.