7 декабря 2025

eur = 88.70 -1.20 (-1.33 %)

btc = 91 145.00$ 1 483.57 (1.65 %)

eth = 3 117.49$ 65.56 (2.15 %)

ton = 1.62$ 0.02 (1.54 %)

usd = 76.09 -0.88 (-1.14 %)

eur = 88.70 -1.20 (-1.33 %)

btc = 91 145.00$ 1 483.57 (1.65 %)

Яндекс готовит единую нейросеть для речи и текста

1 минута на чтение
Яндекс готовит единую нейросеть для речи и текста

Компания «Яндекс» активно занимается разработкой новой нейросетевой модели SpeechGPT, способной одновременно обрабатывать текст и звук.

Об этом стало известно благодаря информации в разделе вакансий компании, на что указывает издание «Ъ». Вакансия предусматривает привлечение инженера в области машинного обучения, который будет работать над мультимодальной моделью. Эта технология позволяет воспринимать и отвечать как в текстовом, так и в аудиоформате, обеспечивая решение различных задач, связанных с обработкой данных.

На данный момент в «Яндексе» уточнили, что работа над мультимодальностью ведется в рамках существующих сервисов, включая голосового ассистента «Алиса». Вопрос о новой модели SpeechGPT пока остается без ответа.

Применение нейросетевых сервисов «Яндекса», таких как «Алиса», уже демонстрирует возможности взаимодействия как с голосовыми, так и с текстовыми запросами. В последнее время функционал таких сервисов расширяется: например, сервис Yandex SpeechSense, изначально предназначенный для анализа работы колл-центров, теперь может обрабатывать текстовые сообщения.

Особенность мультимодальных моделей, по словам экспертов, заключается в их способности обрабатывать информацию в режиме реального времени без необходимости преобразования данных из одного формата в другой, что значительно ускоряет и упрощает обработку запросов.

Мультимодальные модели также расширяют возможности использования речевых технологий, упрощая доступ к ним и объединяя различные технологические процессы в один интерфейс. Это открывает новые горизонты для развития речевых интерфейсов и делает их использование более удобным и эффективным для широкого круга задач.

Читать первым в Telegram-канале «Код Дурова»

Сейчас читают
Редакция рекомендует
Что ты такое, iPhone Air?
Что ты такое, iPhone Air?
[ Обзор ]

Что ты такое, iPhone Air?

Внезапные выводы про батарею спустя неделю

Фото Микк Сид
Микк Сид
Карьера
Блоги 458
билайн
Газпромбанк
Т-Банк
OTP Bank
МТС
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы