ElevenLabs запустила Expressive Mode - голосовые ИИ-агенты научились понимать эмоции в реальном времени

Компания ElevenLabs объявила о запуске Expressive Mode - нового режима для платформы ElevenAgents. Решение позволяет создавать голосовых ИИ-агентов, которые не просто воспроизводят текст, а реагируют на эмоциональное состояние пользователя, корректируя интонацию, паузы и динамику речи.
В основе новинки - модель Eleven v3 Conversational. Это обновлённая система преобразования текста в речь, оптимизированная для живых диалогов. Она учитывает контекст беседы, смысловые акценты и эмоциональный подтекст, избегая характерной для ранних голосовых ассистентов монотонности.
Как работает Expressive Mode
Expressive Mode анализирует параметры живой речи: скорость, громкость, интонационные скачки. Если собеседник говорит быстрее обычного и повышает голос, система может интерпретировать это как признак стресса или раздражения. Если темп замедляется и интонация становится мягче - как облегчение или согласие.
Для обработки речи в реальном времени используется модель транскрипции Scribe v2 Realtime. Она отвечает за распознавание голосовых сигналов и передачу эмоциональных маркеров в систему генерации ответа.
На основе этих данных агент корректирует тайминги - расставляет паузы, снижает или усиливает эмоциональный оттенок, избегает перебивания пользователя. В результате диалог становится более естественным, а взаимодействие - менее механическим.
«Мы стремились создать систему, которая не просто говорит, а слышит и чувствует»,
- отмечают в ElevenLabs.
Поддержка более 70 языков
Отдельное внимание разработчики уделили языковому охвату. Expressive Mode поддерживает свыше 70 языков и учитывает региональные особенности произношения.
В демонстрациях компания показала работу агента на хинди и аргентинском варианте испанского - языках, где ранее выразительность голосовых моделей уступала английскому сегменту. Теперь интонационные нюансы и культурные особенности речи учитываются на уровне архитектуры.
Это важно для глобальных компаний, которые работают на разных рынках и не могут позволить себе «универсальный нейтральный голос» без локальной адаптации.
Практическое применение для бизнеса
Expressive Mode ориентирован прежде всего на службы поддержки, колл-центры и сервисные платформы.
В демонстрационном сценарии агент общается с раздражённым пассажиром, чей рейс был отменён. Вместо формального ответа система использует мягкий тон, замедляет темп и делает паузы в нужных местах, снижая напряжение в разговоре.
По сути, ElevenLabs предлагает бизнесу инструмент для деэскалации конфликтов в автоматическом режиме без потери фирменного стиля бренда.
Платформа ElevenAgents обеспечивает полный цикл внедрения: тестирование, интеграцию в существующие CRM-системы, мониторинг качества диалогов и масштабирование от пилотных проектов до международных развертываний.
Эволюция голосовых ИИ-систем
Если первые голосовые ассистенты ограничивались корректным произнесением текста, то современные модели переходят к анализу эмоционального контекста. Это меняет саму парадигму общения человека с машиной.
Expressive Mode демонстрирует, что следующий этап развития голосовых ИИ - это не только точность распознавания, но и эмоциональная адаптация. В условиях, когда клиент ожидает понимания, а не скриптовых ответов, именно этот фактор может стать конкурентным преимуществом.
Документация и демонстрационные примеры уже доступны на официальном сайте ElevenLabs, а разработчики могут протестировать функцию в живом режиме.


