Google DeepMind показала AI-указатель мыши на базе Gemini

Указатель мыши становится интерфейсом для Gemini
Google DeepMind представила концепцию AI-enabled pointer - указателя мыши, который понимает, на что именно смотрит или указывает пользователь. Проект работает на базе Gemini и должен убрать лишний слой между рабочим экраном и ИИ-ассистентом.
В обычном сценарии пользователь копирует фрагмент страницы, скриншот, таблицу или изображение в отдельный чат с ИИ. DeepMind предлагает обратную логику: ассистент появляется в той среде, где человек уже работает. Например, можно указать на изображение здания и попросить показать маршрут, выделить товары на странице и сравнить их, выбрать часть PDF и попросить краткое резюме для письма.
Сильная часть анонса - не сама команда вроде «исправь это». Такие команды давно есть в интерфейсах. Интереснее попытка связать курсор, визуальный контекст и намерение пользователя в один короткий жест. Если система ошибается в понимании «этого» и «того», вся магия быстро превращается в лишнюю проверку результата.
Команды становятся короче за счёт контекста экрана
DeepMind описывает четыре принципа нового интерфейса: сохранять рабочий поток, совмещать указание и речь, использовать короткие команды вроде «перемести это сюда» и превращать пиксели в структурированные объекты. Последний пункт самый практичный: система должна видеть в изображении, таблице или видео не просто область экрана, а объект, дату, место, фрагмент кода или действие.
В демонстрациях AI-указатель может работать с PDF, таблицами, изображениями, рецептами, кодом и веб-страницами. Пользователь указывает на нужный фрагмент, а Gemini получает контекст без длинного промпта. Для массовых пользователей это важнее, чем рост длины контекстного окна: большинство людей не хотят писать точные промпты, они хотят показать объект и сказать, что с ним сделать.
Первые элементы появятся в Chrome, Googlebook и Disco
Google уже переносит идеи AI-enabled pointer в продукты. В Gemini in Chrome пользователь может спрашивать ассистента о конкретной части веб-страницы, сравнивать выбранные товары и получать помощь по содержимому открытых вкладок. Часть функций Gemini in Chrome разворачивается для подходящих пользователей в отдельных регионах; автоматизация задач через auto browse сначала выходит в preview для подписчиков Google AI Pro и Ultra в США.
Отдельный сценарий связан с Googlebook - новой категорией ноутбуков Google с Gemini Intelligence. В них появится Magic Pointer: функция, которая вызывает контекстные подсказки Gemini прямо у курсора. Google приводит примеры с созданием встречи по дате в письме и визуализацией нового дивана в комнате по двум выбранным изображениям. Первые устройства Googlebook должны выйти осенью 2026 года, партнёрами названы Acer, ASUS, Dell, HP и Lenovo.
Ещё одна площадка - Google Labs Disco. В описании эксперимента AI Enabled Pointer помогает получать ответы без ухода со страницы, продолжать диалог в боковой панели, переходить к нужным частям страницы и добавлять найденные фрагменты в GenTabs. Доступ к Disco открыт через список ожидания.
Ограничения остаются в точности распознавания и доступности
DeepMind не представила AI-enabled pointer как готовый универсальный продукт для всех пользователей. Компания говорит об экспериментальных демо, принципах будущего интерфейса и постепенном переносе идей в Chrome, Googlebook и Labs. Цена отдельной функции, полный список стран и сроки широкого запуска не раскрыты.
Главный риск лежит в точности контекстного понимания. Указатель должен различать, какой именно объект пользователь выбрал, где проходит граница между соседними элементами и какое действие безопасно выполнить. Для чтения страницы ошибка терпима. Для действий с файлами, покупками, бронированием или кодом цена промаха выше.
Этот анонс показывает, куда Google двигает Gemini: из отдельного чат-окна в слой поверх браузера, операционной системы и устройства. Успех будет зависеть не от эффектности демо, а от того, насколько часто пользователю удастся сказать «вот это» и получить правильное действие без ручной доработки.