OpenAI начала открывать доступ пользователям к «продвинутому» голосовому режиму в ChatGPT
Читать первым в Telegram-канале «Код Дурова»
Компания OpenAI начала предоставлять доступ к продвинутому голосовому режиму в чат-боте для подписчиков ChatGPT Plus. Как сообщает The Verge, эта функция была впервые продемонстрирована на презентации GPT-4o в мае 2024 года.
В ходе демонстрации спикеры могли прерывать чат-бота в середине ответа, уточнять информацию и просить его рассказать истории различными голосами, включая драматический стиль, голос робота или даже в форме песни.
Первоначально альфа-версия голосового режима должна была запуститься в конце июня 2024 года, однако запуск был отложен. Разработчики объяснили это необходимостью улучшить способность модели к обнаружению и отклонению определённого контента. В частности, были добавлены фильтры для блокировки запросов на создание музыки или другого защищённого авторским правом аудиоконтента.
После презентации пользователи соцсетей отметили, что голос Sky сильно напоминал голос актрисы Скарлетт Йоханссон и её персонажа из фильма «Она». В ответ на это OpenAI убрала этот голос из использования.
Новый голосовой режим ChatGPT будет включать только четыре голоса, созданных с помощью профессиональных актёров озвучивания. В компании заверили, что чат-бот не сможет подражать голосам других людей. Для всех пользователей ChatGPT Plus планируется открыть доступ к этому режиму осенью 2024 года.