Мини-интервью с исполнительным директором по исследованию данных СберБанка Андреем Кузнецовым о международном конкурсе AIJ Contest 2022.
— Чем AIJC отличается от других соревнований и хакатонов, почему в нём круто участвовать?
— AIJC проходит целый месяц и позволяет оценить, прокачать и развить свои навыки в глубоком обучении и современных архитектурах. Каждая задача имеет большую социальную и научную значимость, уже в базовых решениях мы предлагаем применить новые AI-подходы. В этом году соревнование проходит при поддержке Института искусственного интеллекта AIRI.
— По какому принципу подбираются задачи? И кто может попробовать свои силы — только хардкорные DS или любой желающий?
— Задачи разделяются по уровню сложности, но, так или иначе, минимальных знаний в области DS здесь явно недостаточно. Самая сложная задача — FusionBrain Challenge 2.0 — требует не только знаний в области DS, но и понимания мультимодальных мультизадачных архитектур, которые в последние годы набирают популярность в научной среде. Другие задачи также требуют специфических знаний в отдельных предметных областях, что способствует более быстрому движению вверх по лидерборду.
— Расскажи про самую сложную задачу, почему именно она со звёздочкой?
— В рамках конкурса мы даём одну задачу с высоким уровнем сложности — FusionBrain Challenge 2.0. Это задача со звёздочкой, то есть участник должен будет применить достаточно обширные знания в области DS. Более того, он должен иметь опыт работы с мультимодальными моделями в модальностях «текст» и «изображение». Задача продолжает одноимённую задачу FusionBrain Challenge 2021 года, в которой участники должны были сделать единую архитектуру, умеющую решать 4 задачи одновременно. В этом году мы пошли дальше: модель должна уметь решать уже 12 задач. Дополнительная фишка — то, что только 6 из 12 задач открыты участникам, то есть они знают их описания, метрики оценки качества и имеют предоставленный им обучающий датасет для тюнинга базовой модели на этих данных. Об остальных 6 задачах участнику не известно ничего — кроме того, что они также решаются на основе данных их текстовой и визуальной модальностей и имеют некоторую смысловую связь с открытыми задачами. Для каждой задачи в тестовом датасете сэмплы сопровождаются текстовыми инструкциями, которые должны научить сеть понимать, что ей нужно сделать с входными данными (например, «нарисуй картинку»). Идея заключается в том, что, научившись на открытых задачах, сеть сможет продемонстрировать свои знания на неизвестных задачах, проявив полученные навыки «логики» и «интуиции», чего ранее в подобных задачах не демострировалось никем.
— Можешь поделиться лайфхаками, как быстрее и качественнее решать задачки? Выгоднее участвовать одному или собирать команду?
— Как говорится, одна голова хорошо, а две — лучше. Командой решать задачу, конечно же, эффективнее. Желательно, чтобы участники обладали разными компетенциями: компьютерное зрение, NLP, аудио и т. д. Так смогут рождаться идеи на стыке направлений (как не так давно трансформеры из NLP ворвались в мир компьютерного зрения). Что касается лайфхаков, большое внимание нужно обращать на данные, способы их аугментации, а также тот обзор источников, который мы предоставляем для наших задач: подобранные материалы всегда содержат какие-то релевантные архитектурные трюки, которые могут помочь в реализации успешного решения.
Читать первым в Telegram-канале «Код Дурова»