Perplexity научит Computer делить задачи между локальной моделью и облаком

Hybrid agentic inference для Perplexity Compute будет делить работу между локальной моделью на устройстве пользователя и более мощными облачными моделями. Компания подаёт функцию как способ держать чувствительные данные на компьютере и снижать расход токенов. Полноценный запуск функции заявлен на июль.
Perplexity научит Computer делить задачи между локальной моделью и облаком

Perplexity готовит для Perplexity Computer гибридный режим работы ИИ-агента. Новая функция будет сама решать, какую часть задачи выполнить на устройстве пользователя, а какую отправить в облако к более мощной модели. Для пользователя это должно выглядеть как один сценарий: агент берёт задачу целиком, а вычисления распределяет внутри системы.

Локальная модель отвечает за чувствительные данные

Главный сценарий - работа с файлами, которые пользователь не хочет отправлять в облако. В описании Perplexity речь идёт о финансовых записях, медицинской информации и личных документах. Компактная модель на устройстве должна определять, какие данные лучше оставить локально, а задачи, требующие возможностей frontier-модели, передавать на сервер.

Отличие от привычного выбора «локально или облако» в том, что пользователь не должен заранее выбирать режим. Perplexity Computer будет разбивать задачу и координировать части автоматически, на уровне отдельных шагов. Хорошая идея на бумаге, но качество здесь будет зависеть от маршрутизатора: если он ошибётся, приватные данные могут уйти туда, куда пользователь не рассчитывал, либо сложная задача останется на слабой локальной модели.

Perplexity переносит часть нагрузки с дата-центров на пользовательские устройства

Гибридный режим нужен Perplexity не только для приватности. Компания хочет снизить нагрузку на серверы и расходы на инференс - работу уже обученной модели на пользовательских запросах. Глава Perplexity Аравинд Сринивас описал систему как «диспетчера» для ИИ-задач: она решает, какие операции может выполнить процессор ПК, а какие требуют дата-центра.

Аравинд Сринивас связал анонс с растущей стоимостью вычислений: по его словам, компаниям невыгодно прогонять всё через крупнейшие модели в облаке, а нужная метрика - «эффективная ценность на ватт на пользователя». Формулировка маркетинговая, но направление понятное: если часть запросов выполняется на миллионах пользовательских устройств, каждый облачный ответ обходится дешевле.

Анонс привязан к Computex и рынку AI-ПК

Сринивас представил подход на Computex в Тайбэе вместе с главой Intel Лип-Бу Таном. Intel заинтересована в том, чтобы ПК снова стали заметным вычислительным слоем для ИИ, но Perplexity подчёркивает, что система не завязана на одного производителя чипов и должна работать также с процессорами Nvidia.

Связка с рынком AI-ПК важна: производители ноутбуков и чипов давно продают идею локального ИИ, но пользователям редко понятно, где она даёт реальную пользу. У Perplexity сценарий конкретнее: локальная модель не заменяет облачную, а берёт на себя лёгкие и чувствительные операции - суммаризацию, классификацию, подготовку данных, работу с приватным контекстом.

Computer уже работает с локальными файлами и офисными приложениями

Perplexity Computer постепенно превращается из поискового ассистента в рабочую агентскую среду. В мае Perplexity открыла Personal Computer на Mac для всех пользователей: инструмент подключает локальные файлы, приложения и браузер Comet к Computer, а пользователь управляет разрешениями доступа.

За несколько дней до нового анонса компания также сообщила, что Perplexity Computer стал доступен внутри Microsoft Excel, Word, PowerPoint и Outlook. Там агент работает в боковой панели и может помогать с документами, таблицами, презентациями и письмами; для корпоративных клиентов заявлены SAML SSO, журналы аудита и детальные админ-настройки.

Слабое место - доверие к автоматическому распределению задач

Для Perplexity гибридный режим выглядит логичным продолжением Computer: агент уже получает доступ к локальному контексту, а теперь компания хочет использовать локальное железо как часть вычислительной схемы. Пользовательский выигрыш понятен: меньше отправки личных данных, потенциально ниже задержка на простых действиях, меньше зависимости от перегруженных серверов.

Проблема в другом. Пользователь не видит, где именно выполняется каждый шаг, и вынужден доверять системе маршрутизации. Для массового продукта этого достаточно, если всё работает незаметно. Для корпоративного использования понадобятся более жёсткие элементы контроля: отчётность по тому, какие данные остались на устройстве, какие ушли в облако и почему агент принял такое решение.

06:10
133
Нет комментариев. Ваш будет первым!