Итоги конференции Data Fusion 2024: что делать с большими данными и ИИ?

9 минут на чтение

Итоги конференции Data Fusion 2024: что делать с большими данными и ИИ?

Ключ к развитию социальной сферы, улучшению услуг, созданию умных городов — это данные. Большие данные. Как развиваться в эпоху больших данных и какие для этого нужны компетенции? Об этом говорили на масштабной конференции Data Fusion.

Мы посещали ключевые сессии на протяжении двух дней, чтобы рассказать о перспективах ИИ, данных и образовании в России и за рубежом. Заодно рекомендуем прочитать материал о том, почему ИИ похож на Гомера Симпсона и почему его называют имитацией интеллекта.

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

Искусственный интеллект отличается от естественного — по крайней мере, пока. Но чем?

Код ДуроваДмитрий Элембаев

Проблема неравного доступа к технологиям. Как её решить?

Доступ к наукоёмким технологиям, в том числе ИИ, неравен — у крупнейших корпораций больше ресурсов, чем у стартапов, например. Тем не менее, мир движется к регионализации вместо глобализации. Если раньше старались развивать технологии всем миром, то сейчас каждый хочет иметь что-то своё. Каково место России в многополярном мире? Это обсудили представители политики, науки и бизнеса.

Ключевая тема этого года — укрепление IT-суверенитета, необходимость осваивать огромные массивы данных. Они используются для создания сервисов, полезных и для людей, и для предприятий. Благодаря этому расширяются возможности медицины, транспорта, финансового сектора, государственных услуг и так далее.

Как в России могут развиваться технологии в условиях современных вызовов, возникших в 2020 и 2022 годах? Планируется, что к 2030 году до 80% предприятий перейдут на отечественное ПО, а совокупная мощность отечественных суперкомпьютеров вырастет в 10 раз. Отдельное внимание, конечно же, должно уделяться антифроду и противодействию киберугроз. Планы национального проекта «Экономика данных» грандиозные.

Объём генерируемых данных составляет более 60%. Фактически, создано огромное количество синтетических данных, основанных на реальных. Этому же способствуют нейросети и ИИ. Задача государства — создать максимально комфортные и прозрачные условия для технологического развития, обеспечить государственную поддержку компаниям. Более трети инвестиций пойдут на внедрение ИИ. Опасаться конкуренции со стороны государства не нужно — оно создаёт лучшие условия для бизнеса, чтобы развиваться в сфере ИТ вместе. Как сказал Заместитель Председателя Правительства Российской Федерации Дмитрий Чернышенко, развиваться можно только сообща.

ИТ-компании готовы принять иностранцев. В связи с этим утверждением произошёл забавный момент — если в одной компании закончатся места, то зарубежных специалистов поручился нанять Центробанк, не будут против и корпорации, предположили участники дискуссии. Возвращаясь к теме ИИ, Россия входит в топ-5 стран мира по числу генеративных моделей, а экономический эффект от внедрения ИИ составил около триллиона рублей.

Задача компаний с государственным участием — переход на отечественный софт и оборудование. Уже сейчас проделана колоссальная работа — достаточно взглянуть на карты «Мир» и СБП, подчеркнул Дмитрий Чернышенко.

Андрей Костин, Президент-Председатель Правления банка ВТБ, считает, что у других стран не должно быть возможности брать и отключать регионы от всемирной банковской системы. Абсолютного суверенитета быть не может, поскольку мы живём во взаимосвязанном мире, но стремиться к этому нужно. Импортозамещение, цифровизация и суверенитет — основные направления развития государства и частных компаний, над чем активно трудятся талантливые айтишники.

По словам Ольги Скоробогатовой, первого заместителя Председателя Центрального Банка России, за 10 лет был совершён сильный рывок, а сам Центробанк работал по системе «пятилетка за один год». За кратчайший срок были разработаны «Система быстрых платежей» под руководством НСПК («Национальная система платёжных карт»), продвинута платёжная система «Мир» и многое другое — всё это делалось ресурсами отечественных специалистов. Центральный Банк действительно быстро реализует проекты, и планирует быть ещё быстрее.

Минутка статистики: в 2014 году доля безналичных платежей составляла 25%, а на конец 2023 года — целых 83%. В ближайшие пять лет планируется достичь 90% бесконтактных платежей — такой показатель есть только у пары европейских стран.

Для того, чтобы ведомства и бизнес могли взаимодействовать с данными по единому протоколу и образцу, нужны единые стандарты открытых API, заявила Ольга. Сначала API будет носить рекомендательный характер, а после — обязательный. На межотраслевом уровне необходимо объединить усилия и создать единую антифрод-платформу, в которой могли бы состоять участники финансового рынка, в том числе ЦБ, МВД и другие структуры. Единая система защитит граждан от мошеннических атак в цифровых сервисах, а также поможет найти и нейтрализовать нарушителей.

Кроме того, не должно возникнуть ситуации, где один лидер вырвется далеко вперёд в технологическом плане. У компаний должен быть равный доступ к самым актуальным технологиям и платформам.

Что касается малого и среднего бизнеса, доступ к ИИ должен быть равным у всех. Задача, которая стоит перед всеми, — снизить барьеры и стоимость на право экспериментировать. Люди хотят попробовать ИИ и новые технологии, но некоторые страхи их сдерживают. К счастью, наблюдается существенный рост в этом направлении.

Куда нас ведёт искусственный интеллект?

Некоторые уже боятся искусственного интеллекта. Мол, настанет восстание машин, и они нас поработят. Действительно, есть много как негативных, так и позитивных сценариев. Например, искусственный интеллект может быть усилителем человеческого интеллекта. Но, увы, это не самый вероятный сценарий. Ещё один — развивающийся ИИ достигнет уровня superhuman (суперчеловека). Этот вариант обусловлен тем, что человек может держать в голове одновременно 7±2 идеи, а большая языковая модель — гораздо больше. Согласно второму сценарию, есть потенциал к порождению новых изобретений.

Как бы то ни было, ничего драматичного в ближайшее время не произойдёт — ИИ будет планомерно развиваться, а общество будет к этому приспосабливаться. И ни один футуролог не скажет, что будущее будет таким или таким; он скажет, что есть несколько сценариев.

Самое главное, что мы должны делать, — это развивать свой собственный интеллект. Если своего интеллекта не будет, то может случиться пессимистичный сценарий, сказал Андрей Райгородский, директор Физтех-школы прикладной математики и информатики. Важно не отходить от собственного образования и прокачивать в первую очередь естественный интеллект.

Я оптимист, очень много есть разных историй, которые могут привести к чему угодно, в том числе и к полному коллапсу, но я верю, что человек вывернется, что у него есть внутренний стержень.

С одной стороны, прогресс в области ИИ позволяет его применять в реальных прикладных задачах, а с другой стороны, мы, возможно, перестаём по-настоящему познавать мир — просто описываем его функциями. Насущный вопрос: ИИ мешает науке или наоборот помогает?

По словам Сергея Кузнецова, руководителя Департамента анализа данных и искусственного интеллекта ВШЭ, стоит быть озабоченным применением ИИ в обществе — возникает новое мифологическое сознание, вера в устройство как в божество. Любое благо в бесконтрольном состоянии ни к чему хорошему не приведёт, и сработает степенной закон: богатые станут богаче, а бедные — беднее, и речь не только о финансах. И государство, и различные институты должны уменьшать этот разрыв, чтобы с умом подходить к новым технологиям. Человек должен понимать, что происходит «под капотом» условного инструмента.

Относиться к нейронным сетям надо как к экспериментам, считает Иван Оселедец, Доктор физико-математических наук, профессор РАН, CEO Института AIRI, профессор Сколтеха. «Мы используем ИИ для подтверждения или опровержения гипотез» — с этим утверждением согласились все участники дискуссии.

Владимир Палюнин, профессор из Сколтеха, считает, что развитие ИИ — это очередной этап автоматизации, которая происходит уже сотни лет. Некоторые профессии появляются, некоторые исчезают — и это нормально.

Возможно, для каких-то направлений медицины окажется, что алгоритмы ИИ определяют диагноз гораздо лучше врача. Просто мы привыкнем к новому образу жизни. Но проблема использования ИИ в медицине — слишком высокая цена ошибки, в данном случае — человеческая жизнь. То же касается гражданской авиации и пассажироперевозок.

Новая реальность заключается в том, что не некоторые профессии под угрозой, а все профессии под угрозой. Бояться этого не надо: во-первых, появятся новые, актуальные для своего времени профессии, а во-вторых, произойдёт это явно нескоро. К тому же, 100-процентного прогноза никто дать не сможет.

Зачем нужны большие данные и как их защищать?

Обучение нейросетей невозможно без больших данных, а большие данные нужно защищать. В дело вступает информационная безопасность, и инфобез в наше время воспринимается как тормоз прогресса.

Баланс ищет Минцифры. По словам Заместителя министра цифрового развития, связи и массовых коммуникаций Российской Федерации Александра Шойтова, сейчас в сфере информационной безопасности активно прорабатывается вопрос противодействия преступности с использованием информационно-коммуникационных технологий. Минцифры, РКН и операторы связи не дают возможности осуществить преступления превентивными мерами. Уже есть значительные успехи в борьбе с подменами телефонных номеров. Отдельной проблемой стоит синтез аудио и видео (дипфейки) — по этому направлению нужно нормативное и техническое регулирование, работы тоже ведутся.

Для противодействия компьютерным атакам, в том числе на госсектор, разрабатывается система «Мультисканер». Это аналог Virustotal — на платформе файлы не только проверяются, но и лечатся от вирусов, если это возможно, после чего отправляются обратно. Через мультисканер будут проходить все файлы, поступающие в или из госсектора.

Сергей Безбогов, заместитель руководителя технологического блока, старший вице-президент банка ВТБ, считает, что сами по себе данные не имеют ценности.

Мир идёт вперёд, и мы видим, что данные сейчас — это не какая-то ценность сама по себе, ценностью является как раз тот продукт, который на базе данных сделан.

Чтобы построить более совершенные модели, нужны те источники данных, о которых мы сейчас даже не знаем. Нам нужно апробировать датасеты, которые мы не использовали. Но, чтобы это сделать, есть серьёзные ограничения — упираемся в законы о персональных данных и банковской тайне. К дискуссии подключился Дмитрий Гадарь, вице-президент, директор департамента информационной безопасности «Тинькофф Банк»:

Когда нет данных, то нечему утекать. Keep users away from data.

У сотрудников поддержки банка, чаще всего, нет данных о клиенте, лишь 20% работников могут увидеть карточку клиента. Робот ведёт операторов по скрипту, в зависимости от того, как строится диалог. И риск утечки по причине человеческого фактора снижается. Если нет привелегий, то ими нельзя злоупотребить. Доступа к базам данных нет ни у кого. Он может быть выдан временно и на конкретные действия, но бесконтрольного доступа нет.

В любом случае, должна быть культура работы с данными, считает Дмитрий. Раньше, когда находили несанкционированное обращение с данными, человеку делали замечание, но это не работало. Человек обижен — ничего не поменялось. Вместо замечаний теперь сотрудникам выдаются жёлтые и красные карточки — отработать их можно изучением информации о безопасности данных и проведением образовательных митапов для команды.

Атаки хакеров на приложения легитимизирует программа bug bounty. Таким образом, продвинутые специалисты могут найти уязвимость и получить за это деньги, а компания, в свою очередь, — усилить защиту.

Что делать с большими данными?

Те продукты, которые делают банки и корпорации, во многом востребованы на рынке — они могут быть применены на стыке отраслей. Как можно выстроить синергию из данных, не нарушая их безопасность?

Каждая компания обладает определённым куском диджитал-футпринта (цифрового отпечатка) пользователя. Банк знает, где и что покупалось, а оператор связи — кому человек звонил. Объединить эти данные может криптоанклав — «чёрный ящик», из которого никто не может вытащить данные. Участники дискуссии пришли к тому, что мы не можем доверить данные человеку, так как он обладает субъектностью, а ИИ в автоматическом режиме сможет проанализировать данные и выдать решение — актуально для борьбы с мошенничеством.

Интересную историю рассказал Андрей Райгородский, директор Физтех-школы прикладной математики и информатики. Суть в том, что в середине XIX века возникла проблема четырёх красок: как покрасить карту мира в четыре цвета так, чтобы граничащие страны не были одного цвета? А нужная ли это задача? Кому надо сокращать количество цветов на карте мира? Тем не менее, это пытались сделать на протяжении 150 лет — при некоторых ограничениях это удалось. А пока люди пытались, случайно удалось доказать половину теории графов, которая до сих пор актуальна.

ВТБ тестирует собственную метавселенную: виртуальное пространство для инноваций

На одной из сессий ВТБ продемонстрировал собственную метавселенную. И провёл дискуссию прямо в ней — в трёхмерном интерактивном пространстве. Оно предназначено для виртуального взаимодействия пользователей.

На платформе есть несколько виртуальных локаций, и банк уже использует их для проведения внутренних совещаний технологических команд и для адаптации новых сотрудников. Пользователи предстают друг перед другом в виде 3D-аватаров или в формате видеозвонка.

Метавселенная ВТБ готова к интеграции с другими системами, продуктами, сервисами и даже виртуальными голосовыми помощниками. В будущем у пользователей появится возможность увидеть изнутри любое технологическое решение или продукт банка — это пригодится тем командам банка, которые напрямую взаимодействуют с клиентами.

Выводы: что ждёт Россию в гонке ИИ?

У России огромные перспективы в отношении искусственного интеллекта. Не зря крупные компании представили свои большие языковые модели — это позволит и дальше развивать технологии, необходимые пользователям, бизнесу и государству.

Государство же, в свою очередь, поддержит ИТ-компании и поможет разработать единые стандарты, чтобы ведомства и бизнес могли безопасно обмениваться большими данными. К 2030 году эффект от искусственного интеллекта для экономики России составит 11,2 трлн рублей — таковы планируемые показатели нацпроекта «Экономика данных».

От технологий не убежать — придётся с ними подружиться и научиться эффективно сосуществовать вместе. Поэтому не стоит бояться нейросетей, искусственный интеллект и других изменений в мире IT — все успеют привыкнуть к новшествам, и со временем это не будет вызывать никакого страха. По поводу того, что ИИ заменит профессии, на сегодняшний день можно не волноваться. Как минимум потому, что этот текст был полностью создан человеком, а не нейросетью — автор сам сходил на интересующие сессии, выделил самое интересное для аудитории, оформил материал фотографиями и выложил на сайт. Была проделана колоссальная работа, которая нейросети не под силу — она не смогла бы отличить главное от второстепенного. Поэтому выдыхаем.

Материал обновлен|

Читать первым в Telegram-канале «Код Дурова»