Google разработала DataGemma для борьбы с «галлюцинациями» в языковых моделях

Эта разработка направлена на устранение одной из главных проблем языковых моделей — ошибок в предоставляемой информации. DataGemma использует инновационные подходы для улучшения качества генерации текстов, делая ответы ИИ более достоверными и обоснованными реальными данными.
Google разработала DataGemma для борьбы с «галлюцинациями» в языковых моделях

Google анонсировала новаторскую разработку — DataGemma, направленную на решение одной из основных проблем современных систем искусственного интеллекта: «галлюцинации» языковых моделей. Этот термин описывает ситуацию, когда ИИ уверенно предоставляет пользователям неверные данные или факты, что подрывает доверие к технологиям и ограничивает их применение в научных исследованиях, политике и бизнесе.

DataGemma работает за счёт интеграции языковых моделей с реальными статистическими данными, хранящимися в системе Data Commons, обширном репозитории, включающем более 240 миллиардов данных от авторитетных источников, таких как ООН, ВОЗ и национальные статистические агентства. Это позволяет языковым моделям не только генерировать текст, но и проверять данные, что снижает вероятность ошибок.

Google представила две ключевые модели: DataGemma-RAG-27B-IT и DataGemma-RIG-27B-IT. Обе модели используют различные подходы для обеспечения точности. Первая — Retrieval-Augmented Generation (RAG) — фокусируется на добавлении в ответы контекстуальной информации из Data Commons. Вторая — Retrieval-Interleaved Generation (RIG) — ориентирована на динамическую проверку данных в процессе генерации, что делает её идеальной для задач, требующих высокой точности и анализа.

Модели нацелены на использование в областях, где необходимы точные и детализированные данные, таких как исследования, разработка политик и бизнес-аналитика.

Технология DataGemma была создана на базе модели Gemini и использует её способность обрабатывать длинные контексты, что позволяет ещё больше повысить точность ответов. Благодаря использованию проверенных данных, эта модель позволяет пользователям взаимодействовать с данными через естественный язык, задавая сложные вопросы, такие как, например, корреляция уровня доходов с показателями здоровья в разных регионах.

Google уверена, что DataGemma станет важным шагом в повышении надёжности ИИ в различных отраслях, таких как образование, здравоохранение, государственное управление и экологическая политика.

21:53
34
Google
Google — это глобальная технологическая компания, основанная 4 сентября 1998 года Ларри Пейджем и Сергеем Брином в Калифорнии.
Нет комментариев. Ваш будет первым!
Посещая этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.