ElevenLabs выпускает глобальную версию приложения Reader с поддержкой 32 языков

Стартап ElevenLabs расширяет возможности своего приложения для преобразования текста в речь. Reader теперь доступен по всему миру и поддерживает 32 языка, включая русский. Это открывает новые горизонты для прослушивания текстового контента на различных языках.

Компания ElevenLabs, специализирующаяся на разработке инструментов искусственного интеллекта для создания и редактирования синтетических голосов, объявила о глобальном запуске своего приложения Reader. Теперь пользователи по всему миру смогут прослушивать текстовый контент на 32 языках.

Reader, впервые представленный в июне в США, Великобритании и Канаде, позволяет загружать любые текстовые материалы – статьи, PDF-документы или электронные книги – и прослушивать их на разных языках и голосами. Среди поддерживаемых языков теперь значатся португальский, испанский, французский, хинди, немецкий, японский, арабский, корейский, итальянский, тамильский и шведский.

ElevenLabs, достигшая в начале этого года статуса так называемого "единорога" – частной компании с оценкой более 1 миллиарда долларов – привлекла 80 миллионов долларов (примерно 7,2 миллиарда рублей) от инвесторов, включая известный венчурный фонд Andreessen Horowitz. Компания предоставляет API который другие фирмы могут использовать для различных целей, таких как дубляж или преобразование текста в речь.

Сегодня технологии ElevenLabs используются для голосового взаимодействия на устройстве Rabbit r1, а также для функций text-to-speech на поисковой системе с искусственным интеллектом Perplexity и аудиоплатформах PocketFM и KukuFM. Reader стал первым продуктом компании, ориентированным на массового потребителя.

Стартап сообщил о добавлении сотен новых голосов из своей библиотеки, подходящих для разных языков. В прошлом месяце компания лицензировала голоса таких актеров, как Джуди Гарленд, Джеймс Дин, Берт Рейнольдс и сэр Лоуренс Оливье, для использования в приложении.

ElevenLabs отметила, что расширенная языковая поддержка обеспечивается моделью Turbo v2.5, выпущенной в прошлом месяце. По заявлению компании, эта модель снижает задержку при преобразовании текста в речь и улучшает качество звучания.

Ближайшим конкурентом Reader является Speechify, который предлагает дополнительные функции, такие как сканирование документов для распознавания текста, интеграцию с Gmail и Canvas, а также возможность клонировать собственный голос пользователя для озвучивания текста. Приложения Pocket от Mozilla и аудиоприложение The New York Times на базе Audm также позволяют пользователям прослушивать контент.

Так же ElevenLabs заявила о планах добавить новые функции в приложение, включая поддержку офлайн-режима и возможность делиться аудиофрагментами.

eleven labs синтез речи reader text-to-speech

Читайте новости в Telegram

t.me/ v_neuro