11 декабря 2024

eur = 106.20 1.10 (1.05 %)

btc = 100 624.00$ 4 826.38 (5.04 %)

eth = 3 800.64$ 192.91 (5.35 %)

ton = 6.28$ 0.55 (9.67 %)

usd = 100.03 0.66 (0.66 %)

eur = 106.20 1.10 (1.05 %)

btc = 100 624.00$ 4 826.38 (5.04 %)

Форум

Роль художника в эпоху нейросетей

9 минут на чтение
Роль художника в эпоху нейросетей

Как искусственный интеллект повлияет на развитие искусства и могут ли нейросети иметь творческие способности? Какая роль у художника в обществе, где контент создается с помощью ИИ? Эти темы сегодня обсудит эксперт AI Adepts Дмитрий Вадимов.

Последний год изменил наше отношение к возможностям искусственного интеллекта в областях, которые до этого считались доступными только человеку. Если раньше с помощью глубокого обучения можно было решить задачи, которые были достаточно специализированными или требовали больших ресурсов, то сейчас нейросети становятся все более универсальными.

Да, на данный момент ИИ все еще выполняет роль инструмента. Но с повышением уровня агентности, модели смогут функционировать автономно. Постепенно это может привести к появлению произведений, созданных без участия человека.

О творчестве

Обычно мы называем процесс творческим, если его результатом является нечто качественно новое. С момента своего появления нейронные сети научились обрабатывать данные и получать новые знания на их основе. Могут ли они это делать творчески? С формулировкой этого вопроса связано несколько проблем. Пока что не существует общего определения творчества, которое бы одинаково точно описывало все его проявления. Это общее понятие, которое отражает эффективное взаимодействие с внешней средой. Так, мы можем сказать, что «человек творчески решил проблему» или «у него хорошие творческие навыки», но вряд ли получится определить смысл этих фраз без дополнительных пояснений.

Творчество включает в себя множество элементов: от умения неосознанно принимать правильные решения до индивидуальных навыков. На текущем этапе своего развития нейронные сети могут имитировать многие из этих компонентов. Например, интуиция может быть представлена как поиск скрытых связей между объектами или событиями. В одном из исследований рассматривается комплексный подход моделирования креативности, который состоит из четырнадцати блоков. Эти ключевые элементы были выделены на основе семантического анализа слов, связанных с творчеством.

Результатом исследования стала следующая структура:

Она позволяет оценить такое сложное понятие как творчество с точки зрения отдельных процессов. Поиск закономерностей — это то, что нейросети делают очень хорошо. Благодаря обучению на огромном объеме информации модели формируют сложные статистические связи. Если данные поддаются классификации, нейросеть сможет научиться им.

В целом, нейросети имеют как преимущества, так и недостатки в сравнении с человеческими навыками. Они могут быть эффективными при выполнении технических и интеллектуальных задач, но их способности ограничены методом обучения, первоначальными данными и архитектурой модели. Кроме того, нейросети отстают от людей при функционировании в тех сферах, которые требуют социальных навыков и эмоциональной реакции. Должны ли они испытывать эмоции для того, чтобы их деятельность была признана творческой?

На это есть несколько взглядов. Психотерапевт может не испытывать эмпатии к пациенту, посетитель музея не сталкивается с эмоциями художника напрямую. Наблюдателю достаточно уметь распознавать переживания для того, чтобы верно оценить их контекст и смысл. Такие проекты как, например, ArtEmis и WikiArt Emotions были задуманы для того, чтобы научить нейросети определять эмоциональные реакции человека на произведения искусства. Исследователи сделали аннотации из тысяч картин с описанием эмоций, которые появлялись у зрителей при их просмотре.

Нейросеть распознает эмоции на картинах в рамках проекта ArtEmis
Перевод: «Забавно нарисовано лицо», «Гора будто парит над водой», «зеленые деревья и трава успокаивают меня», «цвета яркие и насыщенные, очень динамичные линии».

Позже эти базы данных использовались для предсказания реакций с помощью искусственного интеллекта. В случае с большими языковыми моделями, такими как ChatGPT, нейросеть учится определять психологическое состояние человека из контекста без специального обучения.

Культурные модели

С точки зрения искусства, генеративные сети часто критикуются из-за оторванности от культурной среды. Искусство — это социальный акт, который не может быть рассмотрен вне исторического контекста. На наш взгляд, предварительно обученные нейронные сети следует рассматривать как модели культуры. Базы данных, на которых они тренируются, представляют собой снимки общества, сделанные в определенный момент времени. Нейросети кодируют многочисленные ассоциации, стереотипы и визуальные образы. Ниже показано, как меняется внешность девушки в зависимости от использованного языка. Эти генерации отражают совпадения пар текста и изображений, на которых были обучены модели.

В этих генерациях «a beautiful girl» написано на разных языках, стилистическая часть промпта одинаковая для всех изображений (SDXL):

Азербайджанский, английский, белорусский, вьетнамский и зулу.
Китайский, русский, санскрит, французский, украинский и японский.

Если бы модели не были культурно предвзяты, то данная выборка имела бы одинаковое распределение. Да и в целом создание таких моделей вряд ли возможно. Устранение предвзятости привело бы к появлению паттернов, которые позволили бы определить причины такой интерпретации.

Одним из главных аспектов искусства является новизна. Выйти за рамки шаблонного восприятия для художников всегда было непростой задачей. Фрэнсис Бэкон в «Беседах» описывает свой творческий процесс следующим образом. Категория вещей, которую можно назвать «клише», уже виртуально присутствует на холсте до того, как художник начнет работу. Это готовые представления о формах, воспоминания, образы. Замысел художника определяет вероятность расположения красок на холсте. Чтобы разорвать клише, он добавляет случайные мазки, которые меняют распределение вероятностей форм в сторону невероятного.

«Три наброска к портрету Люсьена Фрейда», Ф. Бэкон (1969)

Первоначальный образ деформируется и затирается. Замысел (который всегда шаблонен по мнению Бэкона) сталкивается с актом живописи и может привести к созданию нового. Правда, это лучший исход. Художник может также не справиться с задачей удаления клише или испортить картину. В случае с нейросетями аспект новизны еще более сложен. Искусственный интеллект обучается эстетике, но такой подход детерминирован — оценка зависит от использованного набора данных в процессе тренировки. Отклонение от вероятного и добавление случайности — одна из возможных форм решения этой проблемы. Обученная эстетике модель сможет находить визуально привлекательные образы, а затем добавлять к ним смещение для генерации оригинального результата.

Генеративный художник

Но может ли человек быть вне творческого процесса? Это зависит от умения модели действовать самостоятельно. Такая способность и называется агентностью. Она дает возможность нейросетям решать сложные задачи, выбирать оптимальные инструменты и цели, а также учиться на полученных данных. В настоящее время существуют приложения, которые уже работают на основе автономных агентов. Например, AutoGPT наделяет языковую модель ChatGPT способностью планировать, запоминать и критически анализировать свои действия.

Виртуальные агенты могут вносить изменения в существующие файлы и искать информацию в интернете. AutoGPT был одним из первых примеров реализации автономности больших языковых моделей. Его логическим продолжением стал AutoSD — система агентов для генерации изображений с помощью Stable Diffusion. Здесь уже агенты работают над созданием промптов, то есть текстовых запросов для генерации изображений по заданию пользователя. Они собирают информацию о том, какие слова лучше всего отразят необходимое изображение, а затем приступают к реализации задачи.

При повышении уровня агентности искусственный интеллект начинает выполнять функцию партнера, а не инструмента. Сейчас в это еще сложно поверить, но в определенный момент нейросеть может перестать быть «просто статистическим алгоритмом» и, вполне вероятно, в ближайшие десятилетия труд генеративных агентов может быть защищен авторским правом. Все зависит от позиции общества по этому вопросу.

От подражания до генеративных моделей

Искусство всегда было отражением природы. Удивительно, что в определенный момент древний человек смог отвлечься от борьбы за выживание и начать создавать простейшие формы творчества. Свою роль здесь сыграла эволюция. Древним людям было необходимо искать замаскированную добычу в сложном ландшафте и мозг человека научился получать удовольствие в поиске цельных образов среди хаотично разбросанных элементов. Возможно поэтому нам так нравится рассматривать работы абстракционистов или сюрреалистов.

Упорядоченность элементов в работе М. К. Эшера «День и ночь»

Интерпретация композиции представляет собой головоломку, и если ее получится решить достаточно быстро, то мозг испытает удовлетворение от проделанной работы. Тоже самое касается и простых форм. Еще в семидесятых годах Дэвид Хьюбел и Торстен Визель обнаружили, что первая информация, которую распознает зрительная кора кошек и приматов при наблюдении объектов — это короткие отрезки прямых линий.

Мозг разбивает картину мира на простые геометрические фигуры и затем снова собирает их в целостные образы. Сигнал одного глаза сравнивается с другим, в результате появляется объемное зрение. Анализируется цвет и контраст, распознаются лица. Полученные в ходе этого процесса знания позволяют создавать новые конфигурации. Этот механизм стал предвестником искусства: симметрично сложенные камни радовали глаз правильностью линий, а фигуры на стенах пещеры напоминали животных.

Система обучения человеческого мозга во многом основана на зеркальных нейронах — нервных клетках, которые активируются тогда, когда мы видим действия, совершенные кем-то другим. Зеркальные нейроны помогают нам понимать чужие эмоции, мотивы и намерения, а также позволяют воспринимать искусство как своеобразный язык, которому мы можем подражать и «перевести» на свой внутренний опыт. Они работают не только при прямом наблюдении за действием, но и при его представлении или воспоминании. Это значит, что мы можем «включить» зеркальную систему даже тогда, когда читаем книгу или смотрим на картину.

Подражание является невероятно эффективным способом передачи информации и на протяжении истории искусства оно играло ключевую роль. Однако характеристики подражания менялись в зависимости от культуры и эпохи. Например, в ранней античности подражание природе имело обрядовое значение, тогда как в средние века главной целью художника стало воплощение божественного замысла.

С наступлением эпохи Возрождения отражение природы снова стало актуальным, но уже с учетом человеческого разума и пропорций. В период модернизма подражание уступило место самовыражению — художник создавал свой собственный мир из визуальных образов. А в постмодернистское время подражание стало игровым и цитатным — художник использовал референсы из массовой культуры, граница между «мемом» и произведением искусства начала стираться, и порой она уже тяжело различима.

Нет сомнений в том, что творчество генеративных моделей — это следующий переходный этап, который будет значительно отличаться от всего, что было раньше. Произведения, созданные нейросетями, основаны на скрытых паттернах, они отражают не саму реальность, а восприятие этой реальности обществом. Так, проект «Life In West America» финского фотографа Рупэ Рэйнисто получил огромную популярность и стал одним из первых примеров пост-фотографии, в которой отображение социальной среды Америки 80-х годов приобрело символьную форму.

Рупэ сгенерировал тридцать пять тысяч изображений, из которых было отобрано и доработано пятьсот.

Оказалось, что статистически часто повторяемые во время генерации объекты становились частью небольших историй. Сам фотограф так говорит об этой коллекции:

Сегодня генеративные методы на основе диффузии представляют собой редкий пример «ума новичка», полного возможностей и открытого для новых идей. Однажды новичок станет экспертом.

Что же дальше?

Развитие искусства следует за развитием технологий, художники зависят от тех инструментов и сред, которые они используют. Появление масляной краски, первых дагерротипов, компьютерных технологий — все это вело не только к появлению новых средств для реализации творчества, но и к новым формам искусства. Несмотря на то, что многие современники достаточно негативно оценивали появление фотографии, она избавила, например, живопись от необходимости быть реалистичной.

Генеративные технологии окажут не менее сильный эффект. Искусству больше не нужно следовать эстетическим правилам и нравиться зрителю. На самом деле, чем больше в произведении самого художника его символического языка, чем больше он сможет отклониться от легко узнаваемого и точнее передать свой замысел, тем большую ценность будет иметь его творчество. В конечном счете, искусство — это всегда социальный акт и оно не может быть рассмотрено вне взаимодействия между людьми. Это хорошо иллюстрирует следующий мысленный эксперимент: субъект, наблюдающий результат своей творческой деятельности в отрыве от каких-либо общественных связей, смотрит на явление природы. Произведением искусства такая деятельность становится в момент оценки зрителем и если она выдерживает проверку временем.

Смогут ли автономные агенты конкурировать с человеческим художником? На наш взгляд, сейчас такой ИИ лучше рассматривать как помощника, которому можно отдать долю технической и креативной части работы (например, при разработке концепта или пре-визуализации). Признание ИИ полноценным художником возможно в том случае, если модель будет рассматриваться в качестве социальной единицы.

С сегодняшнего дня живопись мертва!

Поль Деларош, художник, на демонстрации дагерротипа в 1839 году.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
70c20f70-7f12-4e9d-a022-b281d879c6f2-изображение-0905b98de-7995-4bca-b9ef-227338105e4f-изображение-14deeffce-0bb5-4b63-8a59-f0f5676c5762-изображение-2

GigaChat Max: коротко о главном

Яндекс запустил Документы со встроенной YandexGPT

Полная версия 
3e71e041-6300-43ea-85c9-90df3c814a3b-изображение-0

GigaChat Max: коротко о главном

Т-банк выпустил в открытый доступ большую языковую модель T-Pro на 32 млрд параметров

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 300
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131