16 октября 2025

eur = 91.73 -0.96 (-1.03 %)

btc = 111 388.00$ -1 692.40 (-1.50 %)

eth = 4 017.74$ - 107.87 (-2.61 %)

ton = 2.22$ -0.08 (-3.32 %)

usd = 78.84 -1.12 (-1.40 %)

eur = 91.73 -0.96 (-1.03 %)

btc = 111 388.00$ -1 692.40 (-1.50 %)

Яндекс готовит единую нейросеть для речи и текста

1 минута на чтение
Яндекс готовит единую нейросеть для речи и текста

Компания «Яндекс» активно занимается разработкой новой нейросетевой модели SpeechGPT, способной одновременно обрабатывать текст и звук.

Об этом стало известно благодаря информации в разделе вакансий компании, на что указывает издание «Ъ». Вакансия предусматривает привлечение инженера в области машинного обучения, который будет работать над мультимодальной моделью. Эта технология позволяет воспринимать и отвечать как в текстовом, так и в аудиоформате, обеспечивая решение различных задач, связанных с обработкой данных.

На данный момент в «Яндексе» уточнили, что работа над мультимодальностью ведется в рамках существующих сервисов, включая голосового ассистента «Алиса». Вопрос о новой модели SpeechGPT пока остается без ответа.

Применение нейросетевых сервисов «Яндекса», таких как «Алиса», уже демонстрирует возможности взаимодействия как с голосовыми, так и с текстовыми запросами. В последнее время функционал таких сервисов расширяется: например, сервис Yandex SpeechSense, изначально предназначенный для анализа работы колл-центров, теперь может обрабатывать текстовые сообщения.

Особенность мультимодальных моделей, по словам экспертов, заключается в их способности обрабатывать информацию в режиме реального времени без необходимости преобразования данных из одного формата в другой, что значительно ускоряет и упрощает обработку запросов.

Мультимодальные модели также расширяют возможности использования речевых технологий, упрощая доступ к ним и объединяя различные технологические процессы в один интерфейс. Это открывает новые горизонты для развития речевых интерфейсов и делает их использование более удобным и эффективным для широкого круга задач.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Доллар впервые с конца мая опустился ниже ₽77 на рынке Форекс

ГигаЧат: коротко о главном

Доллар впервые с конца мая опустился ниже ₽77 на рынке Форекс

Полная версия 
Google представила обновлённый ИИ-генератор видео Veo 3.1 с улучшенной реалистичностью и звуком

ГигаЧат: коротко о главном

Google представила обновлённый ИИ-генератор видео Veo 3.1 с улучшенной реалистичностью и звуком

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Цифра в деле
Цифра в деле
Смотреть
Реклама. ПАО Сбербанк. erid: 2Vtzqv3u7MN
Карьера
Блоги 432
Газпромбанк
OTP Bank
МТС
Т-Банк
X5 Tech
билайн
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы