Продвинутый голосовой режим ChatGPT будет доступен всем подписчикам Plus этой осенью
Всего несколько дней назад OpenAI запустила новый продвинутый голосовой режим ChatGPT, и небольшая группа подписчиков ChatGPT Plus, получивших к нему доступ, уже поделилась своими впечатлениями. В сети появились различные видеоролики, демонстрирующие способности чат-бота петь, имитировать акценты, корректировать произношение и рассказывать истории.
Один из ярких примеров – видео, где пользователь X @nickfloats просит ChatGPT "рассказать историю, как если бы вы были пилотом самолета, обращающимся к пассажирам во время полета". Чат-бот мгновенно реагирует, даже изменяя звук так, чтобы он больше походил на голос из интеркома. Хотя ChatGPT и затруднился выполнить более сложные запросы, например, наложить звук двигателей, сам голос четкий и эмоциональный, и бот хорошо справляется с перебиванием его пользователем.
В беседе, загруженной на YouTube, ChatGPT утверждает, что может обрабатывать запросы на "десятках языков", хотя точное число может варьироваться "в зависимости от того, как считать диалекты и региональные вариации". Один из роликов демонстрирует способность чат-бота корректировать произношение французских слов, давая конкретные указания по изменению интонации. В другом языковом демо ChatGPT говорит по-турецки, выполняя детальный запрос на рассказ эмоциональной истории. Хотя некоторые турецкие пользователи отметили, что акцент не звучит как у носителей языка, бот смог завершить историю и адекватно реагировать, смеясь и плача в определенные моменты.
Бот неплохо справляется с региональными американскими акцентами. В одном из видео демонстрируется целый ряд примеров, включая акценты Нью-Йорка, Бостона, Висконсина и стереотипный акцент "девушки из долины". Другие видео показывают, как продвинутая голосовая функция ChatGPT поет в разных стилях, создавая блюзовую версию "С днем рождения" и, что забавно, пытается имитировать, как бы эту же мелодию спели животные, например, лягушки и кошки.
Интересный факт:
Технология синтеза речи, используемая в новом голосовом режиме ChatGPT, основана на передовых нейронных сетях, которые могут генерировать человекоподобную речь в реальном времени. Это значительный прогресс по сравнению с традиционными системами "текст-в-речь", которые часто звучат с роботизированным акцентом.
В демонстрациях присутствовали несколько различных мужских и женских голосов, хотя стоит отметить, что среди них нет голоса "Sky", похожего на голос Скарлетт Йоханссон, который был удален из сервиса в мае.
Для тех, кто чувствует себя обделенным этими забавными демонстрациями, представитель OpenAI Тая Кристиансон сообщила, что продвинутый голосовой режим будет доступен всем подписчикам ChatGPT Plus этой осенью.
Новый голосовой режим ChatGPT демонстрирует значительный прогресс в области искусственного интеллекта и обработки естественного языка. Для русскоязычных пользователей это открывает перспективы более естественного и многоязычного взаимодействия с ИИ, что может найти применение в образовании, бизнесе и повседневной жизни.