ElevenLabs выпускает глобальную версию приложения Reader с поддержкой 32 языков
Компания ElevenLabs, специализирующаяся на разработке инструментов искусственного интеллекта для создания и редактирования синтетических голосов, объявила о глобальном запуске своего приложения Reader. Теперь пользователи по всему миру смогут прослушивать текстовый контент на 32 языках.
Reader, впервые представленный в июне в США, Великобритании и Канаде, позволяет загружать любые текстовые материалы – статьи, PDF-документы или электронные книги – и прослушивать их на разных языках и голосами. Среди поддерживаемых языков теперь значатся португальский, испанский, французский, хинди, немецкий, японский, арабский, корейский, итальянский, тамильский и шведский.
ElevenLabs, достигшая в начале этого года статуса так называемого "единорога" – частной компании с оценкой более 1 миллиарда долларов – привлекла 80 миллионов долларов (примерно 7,2 миллиарда рублей) от инвесторов, включая известный венчурный фонд Andreessen Horowitz. Компания предоставляет API который другие фирмы могут использовать для различных целей, таких как дубляж или преобразование текста в речь.
Сегодня технологии ElevenLabs используются для голосового взаимодействия на устройстве Rabbit r1, а также для функций text-to-speech на поисковой системе с искусственным интеллектом Perplexity и аудиоплатформах PocketFM и KukuFM. Reader стал первым продуктом компании, ориентированным на массового потребителя.
Стартап сообщил о добавлении сотен новых голосов из своей библиотеки, подходящих для разных языков. В прошлом месяце компания лицензировала голоса таких актеров, как Джуди Гарленд, Джеймс Дин, Берт Рейнольдс и сэр Лоуренс Оливье, для использования в приложении.
ElevenLabs отметила, что расширенная языковая поддержка обеспечивается моделью Turbo v2.5, выпущенной в прошлом месяце. По заявлению компании, эта модель снижает задержку при преобразовании текста в речь и улучшает качество звучания.
Ближайшим конкурентом Reader является Speechify, который предлагает дополнительные функции, такие как сканирование документов для распознавания текста, интеграцию с Gmail и Canvas, а также возможность клонировать собственный голос пользователя для озвучивания текста. Приложения Pocket от Mozilla и аудиоприложение The New York Times на базе Audm также позволяют пользователям прослушивать контент.
Так же ElevenLabs заявила о планах добавить новые функции в приложение, включая поддержку офлайн-режима и возможность делиться аудиофрагментами.