Google DeepMind представила революционный метод мышления для искусственного интеллекта

Британское исследовательское подразделение Google DeepMind представило новое исследование, в котором описывается техника более эффективного использования вычислительных ресурсов при обработке запросов.
Метод под названием «Эволюция разума» (Mind Evolution) использует языковую модель для создания набора возможных решений, которые затем объединяются и улучшаются на основе оценки специального алгоритма. В отличие от последовательных методов рассуждения, таких как самоулучшение или древовидный поиск, новая технология совершенствует готовые решения целиком, а не отдельные шаги рассуждений.
Тестирование на практических задачах
Для проверки эффективности метода исследователи использовали тестовый набор TravelPlanner, оценивающий способность модели составлять план путешествия с учетом предпочтений и ограничений пользователя. На всех уровнях сложности планирования «Эволюция разума» превзошла другие методы.
Планирование встреч
Отдельное внимание было уделено задаче планирования встреч, где модель должна была составлять расписание с учетом количества участников, их доступности, местоположения и времени в пути. Особенность этой задачи заключается в том, что не все встречи могут быть запланированы из-за конфликтующих ограничений.
Результаты тестирования показали значительное превосходство метода «Эволюция разума» над базовыми стратегиями. При этом двухэтапный подход с использованием Gemini 1.5 Pro продемонстрировал еще более впечатляющие результаты, достигнув точности 98,4% на валидационной выборке и 98,2% на тестовой.
Ограничения и перспективы
Исследователи отмечают, что основным ограничением метода является его фокус на задачах планирования на естественном языке, где предложенные решения можно программно оценить и проанализировать.
Концепция оптимизации вычислений во время обработки запросов широко используется в больших языковых моделях, особенно в моделях рассуждений OpenAI o1. Этот подход считается эффективным решением проблемы масштабирования больших языковых моделей.
Недавно Google DeepMind также опубликовала исследование о масштабировании вычислений для диффузионных моделей, а в декабре прошлого года компания представила модель Gemini 2.0 Flash Thinking с улучшенными возможностями рассуждения и демонстрацией процесса мышления.