OpenAI запускает Operator: ИИ-агент для автоматизации интернет-задач

OpenAI представила нового ИИ-агента под названием Operator, способного автоматически выполнять различные задачи в интернете. Агент находится на стадии исследовательского тестирования и доступен для пользователей Pro-версии ChatGPT в США. Новая технология обещает повысить удобство и эффективность взаимодействия с цифровыми интерфейсами.
OpenAI запускает Operator: ИИ-агент для автоматизации интернет-задач

Компания OpenAI сделала новый шаг в развитии искусственного интеллекта, представив ИИ-агента под названием Operator. Эта инновационная система предназначена для выполнения различных интернет-задач, таких как бронирование билетов, оформление покупок в онлайн-магазинах и даже создание мемов. На данный момент Operator находится в стадии исследовательского тестирования и доступен только пользователям Pro-подписки ChatGPT в США.

Что такое Operator?

Operator работает на основе новой модели под названием Computer-Using Agent (CUA). Эта модель объединяет визуальные возможности GPT-4o и передовые методы логического мышления, позволяя агенту не только «видеть» графический интерфейс браузера через скриншоты, но и активно взаимодействовать с ним. Operator может кликать мышью, заполнять формы, переключаться между вкладками и выполнять другие действия, необходимые для выполнения поставленных задач.

Ключевым преимуществом системы является её способность самостоятельно исправлять ошибки. Если Operator сталкивается с неожиданной ситуацией или сложным интерфейсом, он либо использует встроенные механизмы самокоррекции, либо просит пользователя взять управление на себя.

Как работает Operator?

Для начала работы пользователю достаточно описать задачу, которую нужно выполнить. Например, агент может одновременно заказать продукты через сервис Instacart и забронировать отель на Booking.com. В системе предусмотрена возможность настройки персональных предпочтений, таких как выбор авиакомпании или предпочтительных ресторанов. Кроме того, Operator поддерживает сохранение пользовательских запросов, а это делает выполнение повторяющихся задач быстрее и удобнее.

Operator также поддерживает многозадачность, что позволяет пользователю запускать несколько процессов одновременно. Например, агент может оформить заказ на уникальную кружку на Etsy, пока пользователь бронирует кемпинг через Hipcamp.

Особенности безопасности и конфиденциальности

OpenAI сделала безопасность пользователей одним из главных приоритетов при разработке Operator. Агент оснащён несколькими уровнями защиты:

  • Режим Takeover. При вводе конфиденциальной информации, такой как пароли или платёжные данные, система требует вмешательства пользователя. В этот момент Operator приостанавливает выполнение задачи и не сохраняет вводимую информацию.
  • Запросы подтверждения. Перед выполнением значимых действий, таких как отправка электронного письма или оформление заказа, агент запрашивает подтверждение у пользователя.
  • Ограничения на выполнение задач. Operator отказывается выполнять действия, связанные с банковскими транзакциями или решениями с высокими рисками, например, подачей заявлений на работу.

Для защиты конфиденциальных данных пользователи могут удалить историю операций в браузере или всю сохранённую информацию одним кликом. Operator также имеет встроенные механизмы защиты от фишинговых сайтов, вредоносного кода и скрытых запросов.

Возможности и ограничения

На текущем этапе Operator справляется с широким спектром задач, но имеет некоторые ограничения. Например, агент испытывает трудности с использованием сложных интерфейсов, таких как создание презентаций или управление календарём. Однако OpenAI активно собирает отзывы пользователей для дальнейшего улучшения системы.

Важно отметить, что удалённые пользователями данные могут храниться до 90 дней. Это сделано для предотвращения злоупотреблений и улучшения алгоритмов защиты от мошенничества. Хотя такая политика вызвала определённые опасения среди пользователей, OpenAI подчёркивает, что доступ к этим данным ограничен и используется исключительно для обеспечения безопасности.

Перспективы развития

OpenAI планирует значительно расширить функционал Operator. В ближайшем будущем компания намерена открыть доступ к модели CUA через API, что позволит разработчикам создавать собственных ИИ-агентов. Также ожидается интеграция Operator в базовые функции ChatGPT, что обеспечит ещё больше возможностей для автоматизации задач.

OpenAI работает над увеличением аудитории пользователей, включая расширение доступа для подписчиков Plus, Team и Enterprise. Это позволит компании собрать больше обратной связи и доработать систему для массового использования.

Партнёрства и применение

Компания сотрудничает с такими организациями, как DoorDash, Instacart, OpenTable и Uber, чтобы адаптировать Operator для реальных сценариев. В общественном секторе OpenAI работает с администрацией города Стоктон, где агент используется для упрощения записи граждан на городские услуги.

По словам Дэниела Данкера, директора по продуктам Instacart, 

«Operator — это технологический прорыв, который делает процессы, такие как заказ продуктов, невероятно простыми».

Эта система, будучи в стадии раннего тестирования, уже демонстрирует огромный потенциал, делая взаимодействие с интернетом более удобным и безопасным. В будущем Operator может стать универсальным инструментом для автоматизации множества задач.

03:18
124
OpenAI
OpenAI — это исследовательская компания в области искусственного интеллекта, основанная в декабре 2015 года. Целью компании является продвижение и разработка дружелюбного ИИ в интересах всего человечества.
Нет комментариев. Ваш будет первым!
Посещая этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.
Яндекс.Метрика