12 июля 2025

eur = 91.12 -0.38 (-0.41 %)

btc = 117 591.00$ 1 385.30 (1.19 %)

eth = 2 963.64$ 0.29 (0.01 %)

ton = 2.96$ 0.01 (0.48 %)

usd = 77.89 -0.02 (-0.02 %)

eur = 91.12 -0.38 (-0.41 %)

btc = 117 591.00$ 1 385.30 (1.19 %)

Яндекс позволит партнёрам вместе обучать нейросети и раздельно хранить данные

2 минуты на чтение
Федеративное обучение объединяет данные разных организаций (например, Сеченовский университет и ИПС РАН), сохраняя их

GigaChat Max кратко объясняет суть статьи

Яндекс совместно с Институтом системного программирования РАН и Сеченевским университетом впервые внедрили на практике федеративное машинное обучение в медицине. Этот подход позволяет нескольким участникам совместно обучать модели искусственного интеллекта, не передавая собственные наборы данных. В рамках пилотного проекта была создана нейросеть, диагностирующая фибрилляцию предсердий по ЭКГ с высокой точностью. Для обучения использовались независимые датасеты партнеров, а результаты промежуточного обучения передавались на центральный сервер. В дальнейшем технология будет доступна клиентам платформы Yandex Cloud, что расширит возможности сотрудничества компаний, работающих с конфиденциальной информацией, и повысит качество создаваемых моделей.

Яндекс вместе с Институтом системного программирования имени В. П. Иванникова РАН и Сеченовским Университетом первыми в России на практике применили федеративное машинное обучение для задач медицины.

Его также называют совместным, поскольку оно предназначено для проектов, где есть несколько участников с собственными наборами данных, или датасетами. Федеративный подход позволяет участникам коллективно обучать модели, никому не передавая свои данные.

Федеративное обучение: защита данных, разработка нейросетей при дефиците данных, международные научные коллаборации.

Это открывает новые возможности для партнёрств в сфере искусственного интеллекта. Теперь в них смогут участвовать компании из отраслей, где имеют дело с чувствительной информацией: например, финансов, медицины или промышленности.

Как это работает

  • Сперва модель обучается на каждом из датасетов участников проекта. На центральный сервер передаются не сами датасеты, а результаты их обработки — к примеру, изменения в весах модели. Именно на них затем обучается глобальная модель.
  • Таким образом, датасеты на протяжении всего процесса обучения не покидают контуры организаций — и никто, кроме владельцев, не может получить к ним доступ.
Federated → Сервер → Задание → Клиент → Код+Конфиг → Нет → Обучение → Данные → Результат → Да

Яндекс, ИСП РАН и Сеченовский Университет Минздрава России, используя федеративный подход, создали нейросеть, которая по данным электрокардиограмм выявляет фибрилляцию предсердий — одну из наиболее распространенных патологий сердца. Технология делает это с высокими показателями чувствительности и специфичности. Для обучения использовались два независимых датасета с электрокардиограммами: от Сеченовского университета и от ИСП РАН. Оба партнёра провели раунды обучения на своей стороне, а затем передали результаты в общий контур.

Проект реализовали эксперты центра технологий для общества Yandex Cloud. За техническую составляющую проекта отвечали инженеры Yandex Cloud и ИСП РАН. В Yandex Cloud продумали этапы реализации, предложили стек технологий, создали унифицированную среду для обучения и рассчитали необходимый объём ресурсов. В ИСП РАН разработали модель и адаптировали её под опенсорсный фреймворк федеративного обучения. Сеченовский Университет дал экспертную оценку качества модели.

В будущем воспользоваться федеративным машинным обучением смогут клиенты Yandex Cloud. Новый подход позволит участвовать в совместных проектах организациям, которые раньше не могли сотрудничать из-за рисков, связанных с передачей чувствительных данных. Это, в свою очередь, повысит качество итоговых моделей — чем больше партнёров в проекте, тем больше данных для обучения. Кроме того, федеративный метод будет полезен и партнёрам, которых разделяют большие расстояния — например, когда речь идёт о трансграничной передаче данных.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
YouTube меняет принцип показа рекламы для русскоязычных пользователейYouTube меняет принцип показа рекламы для русскоязычных пользователей

GigaChat Max: коротко о главном

YouTube меняет принцип показа рекламы для русскоязычных пользователей

Полная версия 
Хакеры взломали бота McDonald’s паролём «123456» и получили доступ к данным 64 млн соискателей работы

GigaChat Max: коротко о главном

Хакеры взломали бота McDonald’s паролём «123456» и получили доступ к данным 64 млн соискателей работы

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 375
Газпромбанк
Сбер
OTP Bank
Т-Банк
X5 Tech
билайн
МТС
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы