17 декабря 2025

eur = 93.23 -0.34 (-0.36 %)

btc = 86 621.00$ 631.41 (0.73 %)

eth = 2 931.30$ 7.64 (0.26 %)

ton = 1.55$ 0.04 (2.95 %)

usd = 79.45 -0.28 (-0.35 %)

eur = 93.23 -0.34 (-0.36 %)

btc = 86 621.00$ 631.41 (0.73 %)

Яндекс готовит единую нейросеть для речи и текста

1 минута на чтение
Яндекс готовит единую нейросеть для речи и текста

Компания «Яндекс» активно занимается разработкой новой нейросетевой модели SpeechGPT, способной одновременно обрабатывать текст и звук.

Об этом стало известно благодаря информации в разделе вакансий компании, на что указывает издание «Ъ». Вакансия предусматривает привлечение инженера в области машинного обучения, который будет работать над мультимодальной моделью. Эта технология позволяет воспринимать и отвечать как в текстовом, так и в аудиоформате, обеспечивая решение различных задач, связанных с обработкой данных.

На данный момент в «Яндексе» уточнили, что работа над мультимодальностью ведется в рамках существующих сервисов, включая голосового ассистента «Алиса». Вопрос о новой модели SpeechGPT пока остается без ответа.

Применение нейросетевых сервисов «Яндекса», таких как «Алиса», уже демонстрирует возможности взаимодействия как с голосовыми, так и с текстовыми запросами. В последнее время функционал таких сервисов расширяется: например, сервис Yandex SpeechSense, изначально предназначенный для анализа работы колл-центров, теперь может обрабатывать текстовые сообщения.

Особенность мультимодальных моделей, по словам экспертов, заключается в их способности обрабатывать информацию в режиме реального времени без необходимости преобразования данных из одного формата в другой, что значительно ускоряет и упрощает обработку запросов.

Мультимодальные модели также расширяют возможности использования речевых технологий, упрощая доступ к ним и объединяя различные технологические процессы в один интерфейс. Это открывает новые горизонты для развития речевых интерфейсов и делает их использование более удобным и эффективным для широкого круга задач.

Читать первым в Telegram-канале «Код Дурова»

Сейчас читают
Глоссарий Telegram: 200+ терминов и функций мессенджера
Глоссарий Telegram: 200+ терминов и функций мессенджера

Глоссарий Telegram: 200+ терминов и функций мессенджера

Гайд по Telegram: справочник терминов и функций

Читать
Карьера
Блоги 460
OTP Bank
билайн
Газпромбанк
Т-Банк
МТС
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы