26 августа 2025

eur = 93.63 0.12 (0.13 %)

btc = 110 326.00$ -1 061.75 (-0.95 %)

eth = 4 484.00$ - 131.30 (-2.84 %)

ton = 3.14$ -0.07 (-2.17 %)

usd = 80.75 0.49 (0.62 %)

eur = 93.63 0.12 (0.13 %)

btc = 110 326.00$ -1 061.75 (-0.95 %)

Google разработала технологию, раскрашивающую чёрно-белые видео по одной фотографии

1 минута на чтение
Google разработала технологию, раскрашивающую чёрно-белые видео по одной фотографии

Поисковый гигант разработал ИИ, с которым понадобится лишь одна фотография для конвертации чёрно-белых видеозаписей в цветные.

image7

За основу разработчики взяли коллекцию роликов Kinetics. Работает технология следующим образом: первые кадры конвертировали в чёрно-белый цвет, далее нейросеть восстанавливает первоначальный. ИИ разбивает кадры на области, которые нужно окрасить в разные цвета, и отслеживает их перемещение.

Наша гипотеза заключается в том, что временная когерентность цвета обеспечивает отличные широкомасштабные данные для машинного обучения, чтобы отслеживать области в видео. Ясно, что есть исключения, когда цвет не является временно когерентным (например, внезапно включается свет), но в целом стабилен с течением времени. Кроме того, большинство видеороликов содержат цвет, который обеспечивает масштабируемый самоконтролируемый обучающий сигнал. Мы обесцвечиваем видео, а затем добавляем шаг раскраски, потому что могут быть несколько объектов с одним цветом, но таким путём мы можем научить машины отслеживать определённые объекты или области.

В технологии присутстует модель отслеживания человеческих поз, заданных ключевыми точками в исходном кадре. В конечном итоге мы можем наблюдать человеческий скелет из публично доступного академического набора данных JHMDB. Задача обучения нейросетей отслеживанию объектов на видео требует огромного количества входных данных. Вручную это достаточно сложно, именно потому поручают разметку ИИ.

image17

Одной из важных проблем машинного обучения является отсутствие большого количества данных для тренировки моделей. Однако специалисты считают, что дальнейшее улучшение модели раскраски видео может способствовать успеху в самоконтролируемом отслеживании объектов. Также исследователи отметили, что две нейросети, работающие в паре, улучшают результаты работы друг друга.

Подписывайтесь на «Код Дурова» в Telegram и во «ВКонтакте», чтобы всегда быть в курсе интересных новостей!

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
В Spotify появились личные сообщенияВ Spotify появились личные сообщенияВ Spotify появились личные сообщения

GigaChat Max: коротко о главном

В Spotify появились личные сообщения

Полная версия 
Банки будут обязаны раскрывать клиентам причины блокировки карт

GigaChat Max: коротко о главном

Банки будут обязаны раскрывать клиентам причины блокировки карт

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 405
Газпромбанк
X5 Tech
OTP Bank
билайн
МТС
Сбер
Т-Банк
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы