20 января 2025

eur = 104.86 -0.95 (-0.89 %)

btc = 99 892.00$ -4 524.13 (-4.33 %)

eth = 3 182.05$ - 167.28 (-4.99 %)

ton = 4.80$ -0.54 (-10.10 %)

usd = 102.41 0.04 (0.04 %)

eur = 104.86 -0.95 (-0.89 %)

btc = 99 892.00$ -4 524.13 (-4.33 %)

Форум

Google разработала технологию, раскрашивающую чёрно-белые видео по одной фотографии

1 минута на чтение
Google разработала технологию, раскрашивающую чёрно-белые видео по одной фотографии

Поисковый гигант разработал ИИ, с которым понадобится лишь одна фотография для конвертации чёрно-белых видеозаписей в цветные.

image7

За основу разработчики взяли коллекцию роликов Kinetics. Работает технология следующим образом: первые кадры конвертировали в чёрно-белый цвет, далее нейросеть восстанавливает первоначальный. ИИ разбивает кадры на области, которые нужно окрасить в разные цвета, и отслеживает их перемещение.

Наша гипотеза заключается в том, что временная когерентность цвета обеспечивает отличные широкомасштабные данные для машинного обучения, чтобы отслеживать области в видео. Ясно, что есть исключения, когда цвет не является временно когерентным (например, внезапно включается свет), но в целом стабилен с течением времени. Кроме того, большинство видеороликов содержат цвет, который обеспечивает масштабируемый самоконтролируемый обучающий сигнал. Мы обесцвечиваем видео, а затем добавляем шаг раскраски, потому что могут быть несколько объектов с одним цветом, но таким путём мы можем научить машины отслеживать определённые объекты или области.

В технологии присутстует модель отслеживания человеческих поз, заданных ключевыми точками в исходном кадре. В конечном итоге мы можем наблюдать человеческий скелет из публично доступного академического набора данных JHMDB. Задача обучения нейросетей отслеживанию объектов на видео требует огромного количества входных данных. Вручную это достаточно сложно, именно потому поручают разметку ИИ.

image17

Одной из важных проблем машинного обучения является отсутствие большого количества данных для тренировки моделей. Однако специалисты считают, что дальнейшее улучшение модели раскраски видео может способствовать успеху в самоконтролируемом отслеживании объектов. Также исследователи отметили, что две нейросети, работающие в паре, улучшают результаты работы друг друга.

Подписывайтесь на «Код Дурова» в Telegram и во «ВКонтакте», чтобы всегда быть в курсе интересных новостей!

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
505a2e3b-fb15-423d-8ffc-8eaaceb345d9-изображение-0

GigaChat Max: коротко о главном

О чём рассказал суду Павел Дуров на допросе во Франции

Полная версия 
cb3fa187-515f-4482-a8b8-db3f0a3daa2f-изображение-0

GigaChat Max: коротко о главном

ЕС потребовал от соцсети X раскрыть алгоритм рекомендаций и политику модерирования

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 307
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131