4 ноября 2025

eur = 93.38 0.00 (0.00 %)

btc = 107 378.00$ -2 790.78 (-2.53 %)

eth = 3 663.55$ - 194.01 (-5.03 %)

ton = 2.11$ -0.18 (-7.88 %)

usd = 80.89 -0.09 (-0.11 %)

eur = 93.38 0.00 (0.00 %)

btc = 107 378.00$ -2 790.78 (-2.53 %)

Google разработала технологию, раскрашивающую чёрно-белые видео по одной фотографии

1 минута на чтение
Google разработала технологию, раскрашивающую чёрно-белые видео по одной фотографии

Поисковый гигант разработал ИИ, с которым понадобится лишь одна фотография для конвертации чёрно-белых видеозаписей в цветные.

image7

За основу разработчики взяли коллекцию роликов Kinetics. Работает технология следующим образом: первые кадры конвертировали в чёрно-белый цвет, далее нейросеть восстанавливает первоначальный. ИИ разбивает кадры на области, которые нужно окрасить в разные цвета, и отслеживает их перемещение.

Наша гипотеза заключается в том, что временная когерентность цвета обеспечивает отличные широкомасштабные данные для машинного обучения, чтобы отслеживать области в видео. Ясно, что есть исключения, когда цвет не является временно когерентным (например, внезапно включается свет), но в целом стабилен с течением времени. Кроме того, большинство видеороликов содержат цвет, который обеспечивает масштабируемый самоконтролируемый обучающий сигнал. Мы обесцвечиваем видео, а затем добавляем шаг раскраски, потому что могут быть несколько объектов с одним цветом, но таким путём мы можем научить машины отслеживать определённые объекты или области.

В технологии присутстует модель отслеживания человеческих поз, заданных ключевыми точками в исходном кадре. В конечном итоге мы можем наблюдать человеческий скелет из публично доступного академического набора данных JHMDB. Задача обучения нейросетей отслеживанию объектов на видео требует огромного количества входных данных. Вручную это достаточно сложно, именно потому поручают разметку ИИ.

image17

Одной из важных проблем машинного обучения является отсутствие большого количества данных для тренировки моделей. Однако специалисты считают, что дальнейшее улучшение модели раскраски видео может способствовать успеху в самоконтролируемом отслеживании объектов. Также исследователи отметили, что две нейросети, работающие в паре, улучшают результаты работы друг друга.

Подписывайтесь на «Код Дурова» в Telegram и во «ВКонтакте», чтобы всегда быть в курсе интересных новостей!

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
В России заработал закон о блокировке SIM-карт при превышении лимитаВ России заработал закон о блокировке SIM-карт при превышении лимита

ГигаЧат: коротко о главном

В России заработал закон о блокировке SIM-карт при превышении лимита

Полная версия 
Microsoft подтвердила, что баг в «Диспетчере задач» может снижать производительностьMicrosoft подтвердила, что баг в «Диспетчере задач» может снижать производительность

ГигаЧат: коротко о главном

Microsoft подтвердила, что баг в «Диспетчере задач» может снижать производительность

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Цифра в деле
Цифра в деле
Смотреть
Реклама. ПАО Сбербанк. erid: 2Vtzqv3u7MN
Новости
Карьера
Блоги 438
Газпромбанк
билайн
OTP Bank
МТС
Т-Банк
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы