Hermes Agent получил доступ к каталогу браузерных навыков Browse.sh

Nous Research добавила в Hermes Agent интеграцию с Browse.sh - открытым каталогом браузерных навыков Browserbase. Агент получает доступ к готовым инструкциям для работы с сайтами, а не каждый раз заново выясняет, куда нажимать, какие данные читать и какие запросы использовать.
Hermes Agent получил доступ к каталогу браузерных навыков Browse.sh

Готовые инструкции для работы с сайтами

Hermes Agent теперь может использовать Browse.sh - каталог браузерных навыков Browserbase. Проще говоря, агент получает не пустой браузер, где ему нужно самому разбираться с каждым сайтом, а набор готовых инструкций: куда нажимать, какие элементы страницы читать, какие запросы использовать и как действовать, если сайт ведёт себя нестабильно.

Для начинающего исследователя Hermes это важная разница. Обычный браузерный агент часто работает методом проб: открывает страницу, смотрит на интерфейс, пытается понять структуру, ошибается на формах, всплывающих окнах или динамической подгрузке. Навык из Browse.sh заранее описывает типичный маршрут по сайту и помогает агенту не тратить лишние шаги на повторное исследование.

Browse.sh был представлен Browserbase 18 мая 2026 года. На запуске в каталоге заявлено больше 100 навыков для популярных сайтов и веб-сценариев: Amazon, AliExpress, Booking и других. Часть навыков помогает работать через браузерный интерфейс, часть - через API или сетевые запросы, если такой путь быстрее и стабильнее.

Как устроены навыки Browse.sh

Навык в Browse.sh - это файл с инструкциями для агента. Обычно он описывается в формате SKILL.md: внутри могут быть шаги выполнения задачи, полезные селекторы страницы, подсказки по структуре сайта, примеры запросов и запасные варианты, если основной путь не сработал.

Для человека это похоже на короткую техническую памятку: «если хочешь найти объект на этом сайте, начни здесь, используй такие поля, результат лежит в таком блоке». Для агента это экономия времени и контекста. Ему не нужно держать в памяти всю страницу и гадать, какие элементы важны.

Browserbase указывает, что использование готовых DOM-селекторов и XHR-запросов может снижать расход токенов до 50 раз. В практическом смысле это значит, что агент меньше «смотрит глазами» на страницу и чаще обращается к уже известным точкам данных. Такой подход полезен для повторяемых задач: поиска товаров, бронирований, сбора карточек, проверки расписаний, анализа каталогов.

Browse CLI связывает агента с браузером

Browse.sh работает вместе с Browse CLI - инструментом командной строки для управления браузером. Через него агент может открывать страницы, нажимать кнопки, вводить текст, читать структуру страницы, смотреть сетевые запросы и устанавливать навыки из каталога.

Browse CLI поддерживает локальный Chromium и облачные сессии Browserbase. Локальный браузер подходит для простых экспериментов и разработки. Облачные сессии важны для более сложных сайтов: там могут пригодиться прокси, устойчивые профили браузера, работа с CAPTCHA и другие механизмы, которые редко нужны в учебном примере, но быстро появляются в реальных задачах.

Для Hermes Agent это удобно: браузер, навыки, диагностика и облачная инфраструктура оказываются в одном рабочем контуре. Исследователю не нужно отдельно собирать десяток разрозненных инструментов, чтобы проверить, как агент выполняет задачу в интернете.

Зачем это нужно Hermes Agent

Hermes Agent уже строится вокруг идеи самообучающегося агента. Он может работать на сервере пользователя, запоминать опыт, использовать навыки и постепенно улучшать свои действия. В экосистеме Hermes есть собственный Skills Hub: там собраны встроенные, опциональные и пользовательские навыки.

Интеграция с Browse.sh добавляет отдельный слой именно для веб-задач. Если Hermes раньше мог учиться на собственных попытках, теперь он может начинать не с нуля, а с готовой инструкции из общего каталога. Это особенно полезно для задач, где сайты сложные, часто меняются или требуют нескольких точных шагов подряд.

Начинающему исследователю Hermes стоит смотреть на Browse.sh как на библиотеку «памяти о сайтах». Агент не становится безошибочным, но получает более надёжную стартовую точку. Вместо импровизации на каждом шаге он может опираться на заранее описанный маршрут.

Где это может пригодиться на практике

Самый понятный сценарий - повторяемые веб-задачи. Например, агенту нужно найти жильё по заданным параметрам, собрать товары из каталога, проверить маршруты, получить расписание поездов, найти отзывы или подготовить краткий отчёт по компаниям.

Без навыка агент сначала исследует сайт: ищет поля ввода, фильтры, кнопки, карточки результатов. С навыком он уже знает, где обычно находятся важные элементы и какие действия приводят к результату. Это снижает число ошибок и делает выполнение задачи более предсказуемым.

Для исследования Hermes это открывает хороший формат экспериментов: можно сравнивать, как агент выполняет одну и ту же задачу с навыком и без него. Полезно смотреть не только на финальный ответ, но и на трассировку: сколько шагов сделал агент, где ошибся, сколько раз перечитывал страницу, какие данные использовал и смог ли повторить результат во втором запуске.

Ограничения остаются: сайты меняются быстрее навыков

Готовый навык не гарантирует вечную стабильность. Сайты меняют верстку, добавляют новые окна, обновляют фильтры, ограничивают автоматизацию и скрывают часть данных за JavaScript. Если навык опирается на нестабильный селектор или неофициальный запрос, он может сломаться после очередного обновления сайта.

Поэтому Browse.sh лучше воспринимать не как магическое решение, а как способ сделать работу агента более инженерной. Навык можно читать, проверять, исправлять и улучшать. Это важнее, чем один удачный запуск: в реальных задачах ценится повторяемость.

Для Hermes Agent главный тест будет не в том, сколько сайтов перечислено в каталоге, а в том, насколько хорошо агент сможет поддерживать навыки в рабочем состоянии. Если он будет замечать сбои, анализировать трассировки и предлагать исправления, интеграция с Browse.sh станет сильным шагом к более надёжным открытым агентам.

Главный вывод для исследователей Hermes

Интеграция Hermes Agent с Browse.sh показывает, куда движется разработка AI-агентов. Простого доступа к браузеру уже недостаточно. Агенту нужны память, инструменты, понятные инструкции, отладка и возможность повторять успешные сценарии.

Для начинающего исследователя это хороший пример зрелого подхода к агентам. Надёжность появляется не из «умной модели» сама по себе, а из связки модели, навыков, наблюдения за ошибками и регулярного улучшения инструкций. Browse.sh даёт Hermes Agent именно такой внешний слой знаний о вебе.

05:25
178
Нет комментариев. Ваш будет первым!