11 июля 2025

eur = 91.50 0.08 (0.09 %)

btc = 116 254.00$ 5 007.07 (4.50 %)

eth = 2 967.11$ 194.23 (7.00 %)

ton = 2.94$ 0.09 (3.23 %)

usd = 77.90 -0.27 (-0.35 %)

eur = 91.50 0.08 (0.09 %)

btc = 116 254.00$ 5 007.07 (4.50 %)

OpenAI запустила сайт для бесплатной озвучки текстов: как пользоваться новинкой

1 минута на чтение
OpenAI запустила сайт для бесплатной озвучки текстов: как пользоваться новинкойКак видит новость Kandinsky

GigaChat Max кратко объясняет суть статьи

OpenAI представила сайт OpenAI.fm, позволяющий озвучивать тексты с помощью ИИ. Сайт предлагает 11 различных голосов и настройки эмоций и характера речи, включая драматический стиль, спокойную речь, манеру Санта-Клауса или спортивного комментатора. Доступны тексты на 100 языках, включая русский. Пользователи могут бесплатно протестировать озвучивание через демо-версию, а разработчики получают доступ к созданию голосовых агентов и транскрибации речи с оплатой от $0,003 до $0,015 за минуту.

OpenAI запустила сайт OpenAI.fm, с помощью которого можно озвучить любой текст. Рассказываем о новинке и приводим краткую инструкцию по использованию.

OpenAI.fm предлагает версию для разработчиков — в ней дополнительно будет доступно создание голосовых агентов и транскрибирование аудиозаписей, а также бесплатную демо-версию — с помощью неё получится только озвучить текст. Модель представлена на базе GPT-4o и доступна для текстов на 100 языках, в том числе русском.

Модель «разговаривает» одиннадцатью голосами, для которых можно задать тон, эмоции и характер. Например, можно попросить ИИ говорить драматично, спокойно, в стиле Санта Клауса или спортивного тренера.

Редакция «Кода Дурова» протестировала демо-версию модели — делимся результатами ниже.

OpenAI запустила сайт для бесплатной озвучки текстов: как пользоваться новинкой

Переходим на сайт OpenAI.fm. Перед вами 11 вариантов голосов (от Alloy до Verse) и множество вариантов настроений. Это не все доступные варианты — нажмите «Обновить» и откройте новые варианты — нам попадалось настроение эмо-подростка, фитнес-тренера, безумного учёного и даже любителя тру-крайма.

Введите текст в правое поле — мы выбрали приветствие с сайта редакции «Кода Дурова». Выбираем голос и настроение и нажимаем «Play».

Такое аудио получилось у нас. Его можно скачать или поделиться ссылкой через соответствующие кнопки внизу.

Модель для распознавания речи и преобразования её в текст основана на gpt-4o-transcribe и gpt-4o-mini-transcribe. Она доступна для разработчиков, стоимость использования — $0,006 и $0,003 за минуту аудио соответственно. Модель gpt-4o-mini-tts преобразует текст в аудио, 1 минута речи стоит $0,015.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
Госдума одобрила штрафы до 1 млн рублей за нарушения в работе хостинг-провайдеров

GigaChat Max: коротко о главном

Госдума одобрила штрафы до 1 млн рублей за нарушения в работе хостинг-провайдеров

Полная версия 
YouTube закроет раздел «В тренде» после 10 лет работы

GigaChat Max: коротко о главном

YouTube закроет раздел «В тренде» после 10 лет работы

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 375
Газпромбанк
Сбер
OTP Bank
Т-Банк
X5 Tech
билайн
МТС
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы