OpenAI запустила сайт для бесплатной озвучки текстов: как пользоваться новинкой

1 минута на чтение
OpenAI запустила сайт для бесплатной озвучки текстов: как пользоваться новинкойКак видит новость Kandinsky

GigaChat Max кратко объясняет суть статьи

OpenAI запустила сайт OpenAI.fm, позволяющий озвучивать тексты на основе модели GPT-4o. Доступны 11 голосов с различными тонами и эмоциями. Разработчикам предлагается версия с дополнительными функциями, включая создание голосовых агентов и транскрибирование аудио. Бесплатная демо-версия ограничена только озвучиванием текста. Стоимость использования моделей для разработчиков составляет от $0,003 до $0,015 за минуту аудио.

OpenAI запустила сайт OpenAI.fm, с помощью которого можно озвучить любой текст. Рассказываем о новинке и приводим краткую инструкцию по использованию.

OpenAI.fm предлагает версию для разработчиков — в ней дополнительно будет доступно создание голосовых агентов и транскрибирование аудиозаписей, а также бесплатную демо-версию — с помощью неё получится только озвучить текст. Модель представлена на базе GPT-4o и доступна для текстов на 100 языках, в том числе русском.

Модель «разговаривает» одиннадцатью голосами, для которых можно задать тон, эмоции и характер. Например, можно попросить ИИ говорить драматично, спокойно, в стиле Санта Клауса или спортивного тренера.

Редакция «Кода Дурова» протестировала демо-версию модели — делимся результатами ниже.

Переходим на сайт OpenAI.fm. Перед вами 11 вариантов голосов (от Alloy до Verse) и множество вариантов настроений. Это не все доступные варианты — нажмите «Обновить» и откройте новые варианты — нам попадалось настроение эмо-подростка, фитнес-тренера, безумного учёного и даже любителя тру-крайма.

Введите текст в правое поле — мы выбрали приветствие с сайта редакции «Кода Дурова». Выбираем голос и настроение и нажимаем «Play».

Такое аудио получилось у нас. Его можно скачать или поделиться ссылкой через соответствующие кнопки внизу.

Модель для распознавания речи и преобразования её в текст основана на gpt-4o-transcribe и gpt-4o-mini-transcribe. Она доступна для разработчиков, стоимость использования — $0,006 и $0,003 за минуту аудио соответственно. Модель gpt-4o-mini-tts преобразует текст в аудио, 1 минута речи стоит $0,015.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
760f5301-6827-4c49-aa49-7264ecb0a13c-изображение-04db0dcaa-b568-44d9-8ad8-32ca1769e3d6-изображение-19efe06f2-5232-400d-b579-20e8e8c50dc0-изображение-2

GigaChat Max: коротко о главном

Вышло апрельское обновление «Алисы» и умного дома Яндекса. Что нового?

Полная версия 
fb8e45e9-7040-4a0c-be1f-6b158f2e6d9a-изображение-06f16f589-1763-4f81-9ac1-4c94aaf7263e-изображение-151e32fc0-ccef-4d91-9a2d-7952c5c32c4a-изображение-2

GigaChat Max: коротко о главном

билайн усилил надёжность сети, модернизировав Ярославский ЦОД

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 345
билайн
Газпромбанк
Т-Банк
МТС
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан
Банк 131