ElevenLabs запустила Expressive Mode - голосовые ИИ-агенты научились понимать эмоции в реальном времени

Технология анализирует интонацию, темп и контекст диалога в реальном времени, чтобы адаптировать голос и манеру речи под состояние собеседника. Разработка ориентирована на клиентские сервисы, где важны эмпатия, деэскалация конфликтов и соблюдение тональности бренда.
ElevenLabs запустила Expressive Mode - голосовые ИИ-агенты научились понимать эмоции в реальном времени

Компания ElevenLabs объявила о запуске Expressive Mode - нового режима для платформы ElevenAgents. Решение позволяет создавать голосовых ИИ-агентов, которые не просто воспроизводят текст, а реагируют на эмоциональное состояние пользователя, корректируя интонацию, паузы и динамику речи.

В основе новинки - модель Eleven v3 Conversational. Это обновлённая система преобразования текста в речь, оптимизированная для живых диалогов. Она учитывает контекст беседы, смысловые акценты и эмоциональный подтекст, избегая характерной для ранних голосовых ассистентов монотонности.

Как работает Expressive Mode

Expressive Mode анализирует параметры живой речи: скорость, громкость, интонационные скачки. Если собеседник говорит быстрее обычного и повышает голос, система может интерпретировать это как признак стресса или раздражения. Если темп замедляется и интонация становится мягче - как облегчение или согласие.

Для обработки речи в реальном времени используется модель транскрипции Scribe v2 Realtime. Она отвечает за распознавание голосовых сигналов и передачу эмоциональных маркеров в систему генерации ответа.

На основе этих данных агент корректирует тайминги - расставляет паузы, снижает или усиливает эмоциональный оттенок, избегает перебивания пользователя. В результате диалог становится более естественным, а взаимодействие - менее механическим.

«Мы стремились создать систему, которая не просто говорит, а слышит и чувствует», 

- отмечают в ElevenLabs.

Поддержка более 70 языков

Отдельное внимание разработчики уделили языковому охвату. Expressive Mode поддерживает свыше 70 языков и учитывает региональные особенности произношения.

В демонстрациях компания показала работу агента на хинди и аргентинском варианте испанского - языках, где ранее выразительность голосовых моделей уступала английскому сегменту. Теперь интонационные нюансы и культурные особенности речи учитываются на уровне архитектуры.

Это важно для глобальных компаний, которые работают на разных рынках и не могут позволить себе «универсальный нейтральный голос» без локальной адаптации.

Практическое применение для бизнеса

Expressive Mode ориентирован прежде всего на службы поддержки, колл-центры и сервисные платформы.

В демонстрационном сценарии агент общается с раздражённым пассажиром, чей рейс был отменён. Вместо формального ответа система использует мягкий тон, замедляет темп и делает паузы в нужных местах, снижая напряжение в разговоре.

По сути, ElevenLabs предлагает бизнесу инструмент для деэскалации конфликтов в автоматическом режиме без потери фирменного стиля бренда.

Платформа ElevenAgents обеспечивает полный цикл внедрения: тестирование, интеграцию в существующие CRM-системы, мониторинг качества диалогов и масштабирование от пилотных проектов до международных развертываний.

Эволюция голосовых ИИ-систем

Если первые голосовые ассистенты ограничивались корректным произнесением текста, то современные модели переходят к анализу эмоционального контекста. Это меняет саму парадигму общения человека с машиной.

Expressive Mode демонстрирует, что следующий этап развития голосовых ИИ - это не только точность распознавания, но и эмоциональная адаптация. В условиях, когда клиент ожидает понимания, а не скриптовых ответов, именно этот фактор может стать конкурентным преимуществом.

Документация и демонстрационные примеры уже доступны на официальном сайте ElevenLabs, а разработчики могут протестировать функцию в живом режиме.

11:20
246
Нет комментариев. Ваш будет первым!