26 июня 2025

eur = 91.74 1.90 (2.11 %)

btc = 107 986.00$ 1 381.55 (1.30 %)

eth = 2 501.97$ 44.73 (1.82 %)

ton = 2.87$ -0.04 (-1.33 %)

usd = 78.39 0.10 (0.12 %)

eur = 91.74 1.90 (2.11 %)

btc = 107 986.00$ 1 381.55 (1.30 %)

OpenAI запустила сайт для бесплатной озвучки текстов: как пользоваться новинкой

1 минута на чтение
OpenAI запустила сайт для бесплатной озвучки текстов: как пользоваться новинкойКак видит новость Kandinsky

GigaChat Max кратко объясняет суть статьи

OpenAI представила сайт OpenAI.fm, позволяющий озвучивать тексты с помощью ИИ. Сайт предлагает 11 различных голосов и настройки эмоций и характера речи, включая драматический стиль, спокойную речь, манеру Санта-Клауса или спортивного комментатора. Доступны тексты на 100 языках, включая русский. Пользователи могут бесплатно протестировать озвучивание через демо-версию, а разработчики получают доступ к созданию голосовых агентов и транскрибации речи с оплатой от $0,003 до $0,015 за минуту.

OpenAI запустила сайт OpenAI.fm, с помощью которого можно озвучить любой текст. Рассказываем о новинке и приводим краткую инструкцию по использованию.

OpenAI.fm предлагает версию для разработчиков — в ней дополнительно будет доступно создание голосовых агентов и транскрибирование аудиозаписей, а также бесплатную демо-версию — с помощью неё получится только озвучить текст. Модель представлена на базе GPT-4o и доступна для текстов на 100 языках, в том числе русском.

Модель «разговаривает» одиннадцатью голосами, для которых можно задать тон, эмоции и характер. Например, можно попросить ИИ говорить драматично, спокойно, в стиле Санта Клауса или спортивного тренера.

Редакция «Кода Дурова» протестировала демо-версию модели — делимся результатами ниже.

OpenAI запустила сайт для бесплатной озвучки текстов: как пользоваться новинкой

Переходим на сайт OpenAI.fm. Перед вами 11 вариантов голосов (от Alloy до Verse) и множество вариантов настроений. Это не все доступные варианты — нажмите «Обновить» и откройте новые варианты — нам попадалось настроение эмо-подростка, фитнес-тренера, безумного учёного и даже любителя тру-крайма.

Введите текст в правое поле — мы выбрали приветствие с сайта редакции «Кода Дурова». Выбираем голос и настроение и нажимаем «Play».

Такое аудио получилось у нас. Его можно скачать или поделиться ссылкой через соответствующие кнопки внизу.

Модель для распознавания речи и преобразования её в текст основана на gpt-4o-transcribe и gpt-4o-mini-transcribe. Она доступна для разработчиков, стоимость использования — $0,006 и $0,003 за минуту аудио соответственно. Модель gpt-4o-mini-tts преобразует текст в аудио, 1 минута речи стоит $0,015.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
a7519e9c-5056-4bc0-91d7-c074c25a6bbf-изображение-0

GigaChat Max: коротко о главном

Фёдор Минькин на GigaConf 2025: уникальность GigaChat состоит в фокусе на русскоязычных пользователей

Полная версия 
7484487c-6a02-45ac-b374-582c74cb1fc0-изображение-0d2136239-cc3b-4002-893c-bc7e75221f38-изображение-196b95c47-e0b3-42bf-aff2-03017ae673a4-изображение-2

GigaChat Max: коротко о главном

Google представила Imagen 4 модель для генерации изображений с улучшенным качеством текста

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 366
X5 Tech
Газпромбанк
билайн
Сбер
Т-Банк
МТС
Яндекс Практикум
Ozon Tech
Циан
Банк 131

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы