12 декабря 2024

eur = 106.20 1.10 (1.05 %)

btc = 101 504.00$ 4 832.23 (5.00 %)

eth = 3 828.79$ 192.62 (5.30 %)

ton = 6.33$ 0.43 (7.24 %)

usd = 100.03 0.66 (0.66 %)

eur = 106.20 1.10 (1.05 %)

btc = 101 504.00$ 4 832.23 (5.00 %)

Форум

Google разработала технологию, раскрашивающую чёрно-белые видео по одной фотографии

1 минута на чтение
Google разработала технологию, раскрашивающую чёрно-белые видео по одной фотографии

Поисковый гигант разработал ИИ, с которым понадобится лишь одна фотография для конвертации чёрно-белых видеозаписей в цветные.

image7

За основу разработчики взяли коллекцию роликов Kinetics. Работает технология следующим образом: первые кадры конвертировали в чёрно-белый цвет, далее нейросеть восстанавливает первоначальный. ИИ разбивает кадры на области, которые нужно окрасить в разные цвета, и отслеживает их перемещение.

Наша гипотеза заключается в том, что временная когерентность цвета обеспечивает отличные широкомасштабные данные для машинного обучения, чтобы отслеживать области в видео. Ясно, что есть исключения, когда цвет не является временно когерентным (например, внезапно включается свет), но в целом стабилен с течением времени. Кроме того, большинство видеороликов содержат цвет, который обеспечивает масштабируемый самоконтролируемый обучающий сигнал. Мы обесцвечиваем видео, а затем добавляем шаг раскраски, потому что могут быть несколько объектов с одним цветом, но таким путём мы можем научить машины отслеживать определённые объекты или области.

В технологии присутстует модель отслеживания человеческих поз, заданных ключевыми точками в исходном кадре. В конечном итоге мы можем наблюдать человеческий скелет из публично доступного академического набора данных JHMDB. Задача обучения нейросетей отслеживанию объектов на видео требует огромного количества входных данных. Вручную это достаточно сложно, именно потому поручают разметку ИИ.

image17

Одной из важных проблем машинного обучения является отсутствие большого количества данных для тренировки моделей. Однако специалисты считают, что дальнейшее улучшение модели раскраски видео может способствовать успеху в самоконтролируемом отслеживании объектов. Также исследователи отметили, что две нейросети, работающие в паре, улучшают результаты работы друг друга.

Подписывайтесь на «Код Дурова» в Telegram и во «ВКонтакте», чтобы всегда быть в курсе интересных новостей!

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
70c20f70-7f12-4e9d-a022-b281d879c6f2-изображение-0905b98de-7995-4bca-b9ef-227338105e4f-изображение-14deeffce-0bb5-4b63-8a59-f0f5676c5762-изображение-2

GigaChat Max: коротко о главном

Яндекс запустил Документы со встроенной YandexGPT

Полная версия 
3e71e041-6300-43ea-85c9-90df3c814a3b-изображение-0

GigaChat Max: коротко о главном

Т-банк выпустил в открытый доступ большую языковую модель T-Pro на 32 млрд параметров

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 300
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131