OpenAI запустила сайт для бесплатной озвучки текстов: как пользоваться новинкой

18:19, 21 марта 2025

18:19, 21 марта 20251 минута на чтение

Кодик кратко объясняет суть статьи

OpenAI представила сайт OpenAI.fm, позволяющий озвучивать тексты с помощью ИИ. Сайт предлагает 11 различных голосов и настройки эмоций и характера речи, включая драматический стиль, спокойную речь, манеру Санта-Клауса или спортивного комментатора. Доступны тексты на 100 языках, включая русский. Пользователи могут бесплатно протестировать озвучивание через демо-версию, а разработчики получают доступ к созданию голосовых агентов и транскрибации речи с оплатой от $0,003 до $0,015 за минуту.

Работает на базе Yandex AI Studio

Читайте в Telegram

OpenAI запустила сайт OpenAI.fm, с помощью которого можно озвучить любой текст. Рассказываем о новинке и приводим краткую инструкцию по использованию.

OpenAI.fm предлагает версию для разработчиков — в ней дополнительно будет доступно создание голосовых агентов и транскрибирование аудиозаписей, а также бесплатную демо-версию — с помощью неё получится только озвучить текст. Модель представлена на базе GPT-4o и доступна для текстов на 100 языках, в том числе русском.

Модель «разговаривает» одиннадцатью голосами, для которых можно задать тон, эмоции и характер. Например, можно попросить ИИ говорить драматично, спокойно, в стиле Санта Клауса или спортивного тренера.

Редакция «Кода Дурова» протестировала демо-версию модели — делимся результатами ниже.

Переходим на сайт OpenAI.fm. Перед вами 11 вариантов голосов (от Alloy до Verse) и множество вариантов настроений. Это не все доступные варианты — нажмите «Обновить» и откройте новые варианты — нам попадалось настроение эмо-подростка, фитнес-тренера, безумного учёного и даже любителя тру-крайма.

Введите текст в правое поле — мы выбрали приветствие с сайта редакции «Кода Дурова». Выбираем голос и настроение и нажимаем «Play».

Такое аудио получилось у нас. Его можно скачать или поделиться ссылкой через соответствующие кнопки внизу.

Модель для распознавания речи и преобразования её в текст основана на gpt-4o-transcribe и gpt-4o-mini-transcribe. Она доступна для разработчиков, стоимость использования — $0,006 и $0,003 за минуту аудио соответственно. Модель gpt-4o-mini-tts преобразует текст в аудио, 1 минута речи стоит $0,015.

Материал обновлен|09:52, 23 мая 2025

Обсудить

Сбер представил GigaChat Audio — модель распознаёт эмоции и ищет моменты в длинных аудиозаписях

Домен t.me снова заработал — ссылки Telegram теперь доступны

В Сеть попали цены и характеристики Pixel 11 и Pixel 11 Pro

Huawei представила глобальные версии Pura 90s Pro и Pro Max, наушники FreeClip 2 S и планшет MatePad Air

Telegram начал приглашать победителей конкурсов в закрытое тестирование Serverless Bot API

Google, Apple и GitHub могли заблокировать в России