OpenAI запустила сайт для бесплатной озвучки текстов: как пользоваться новинкой


OpenAI запустила сайт OpenAI.fm, с помощью которого можно озвучить любой текст. Рассказываем о новинке и приводим краткую инструкцию по использованию.
OpenAI.fm предлагает версию для разработчиков — в ней дополнительно будет доступно создание голосовых агентов и транскрибирование аудиозаписей, а также бесплатную демо-версию — с помощью неё получится только озвучить текст. Модель представлена на базе GPT-4o и доступна для текстов на 100 языках, в том числе русском.
Модель «разговаривает» одиннадцатью голосами, для которых можно задать тон, эмоции и характер. Например, можно попросить ИИ говорить драматично, спокойно, в стиле Санта Клауса или спортивного тренера.
Редакция «Кода Дурова» протестировала демо-версию модели — делимся результатами ниже.

Переходим на сайт OpenAI.fm. Перед вами 11 вариантов голосов (от Alloy до Verse) и множество вариантов настроений. Это не все доступные варианты — нажмите «Обновить» и откройте новые варианты — нам попадалось настроение эмо-подростка, фитнес-тренера, безумного учёного и даже любителя тру-крайма.
Введите текст в правое поле — мы выбрали приветствие с сайта редакции «Кода Дурова». Выбираем голос и настроение и нажимаем «Play».
Такое аудио получилось у нас. Его можно скачать или поделиться ссылкой через соответствующие кнопки внизу.
Модель для распознавания речи и преобразования её в текст основана на gpt-4o-transcribe и gpt-4o-mini-transcribe. Она доступна для разработчиков, стоимость использования — $0,006 и $0,003 за минуту аудио соответственно. Модель gpt-4o-mini-tts преобразует текст в аудио, 1 минута речи стоит $0,015.
Читать первым в Telegram-канале «Код Дурова»