Читать первым в Telegram-канале «Код Дурова»
Уходящий 2022 год запомнится многим как время расцвета нейросетей. Этот год подарил нам множество удивительных проектов на основе искусственного интеллекта и породил множество споров.
Для тех, кто не следил за миром нейросетей в уходящем году, мы собрали подборку, в которой мы коротко расскажем о самых важных событиях, связанных с ИИ. Если вдруг мы что-то забыли, не стесняйтесь напомнить нам в комментариях. Поехали!
Релиз Chat GPT (декабрь 2022)
ChatGPT – чат-бот от компании OpenAI с продвинутой языковой моделью. Был запущен в рамках бесплатного открытого бета-тестирования в этом месяце, но уже успел завоевать огромную популярность в интернете благодаря своим возможностям.
Умные чат‑боты, отвечающие на вопросы, уже стали привычной вещью. Но ChatGPT работает намного глубже, не имея при этом доступа к интернету. ChatGPT даёт прямые ответы текстом и решает задачи с описанием шагов. Чат‑бот ориентируется в большом количестве разных тем и при этом не выдаёт несуразицу.
Языковая модель чат-бота обладает уникальной возможностью – она способна не просто выискивать данные по ключевым словам, но комбинировать и интерпретировать эти данные в соответствии с контекстом появления соответствующих слов в обучающей базе, формируя в итоге именно тот ответ, который необходим пользователю.
ChatGPT может писать сложные эссе, решать сложные математические задачи и даже написать сценарий к фильму. Нейросеть также хорошо разбирается в программировании и может найти ошибку в коде или даже написать его с нуля. У нас на сайте даже есть статья о том, как пользоваться данным ботом.
Многие студенты уже оценили всю пользу данной нейросети и начали активно применять её в учёбе, в то же время учителя обеспокоены тем, что настолько продвинутый ИИ-помощник ставит под угрозу желание учеников учиться и развивать навыки.
Руководство Google при этом серьёзно встряхнулось после релиза ChatGPT, ведь такой продвинутый чат-ассистент может серьёзно ударить по поисковой системе Google.
А один энтузиаст по имени Ammaar Reshi даже написал с помощью ChatGPT полноценную детскую книгу, обложку к которой ему помогла нарисовать другая нейросеть – Midjourney. Теперь он продаёт эту книгу на Amazon по цене в $9.
Релиз Midjourney (март 2022)
Midjourney открылась для публики в марте в рамках ранней волны моделей генерации изображений на основе ИИ. Она быстро завоевала большое количество поклонников благодаря своему выразительному стилю и тому, что стала общедоступной раньше, чем DALL-E и Stable Diffusion. Midjourney ознаменовала прорыв среди нейросетей, то и дело создавая шедевр из каждого запроса.
Со временем Midjourney улучшила свою модель, добавив в неё больше обучения, новых функций и больше деталей. Текущая модель v4 сейчас тестируется тысячами членов сервера Discord.
Проект общедоступен, и любой может воспользоваться нейросетью в специальном Discord-боте. Работает бот по модели платной подписки, но имеет пробный период в GPU-минутах, которого хватит примерно на 25 картинок.
Midjourney множество раз мелькала в заголовках СМИ, в частности, один из участников государственного конкурса изящных искусств в Колорадо Джейсон Аллен занял 1-ое место, сгенерировав картину с помощью Midjourney.
В сети многие художники даже обвинили Аллена в том, что он ускорил смерть творческих профессий.
Релиз Stable Diffusion (август 2022)
Общедоступный релиз Stable Diffusion – одно из важнейших событий в мире графических нейросетей, ведь в отличие от DALL-E и Midjourney, исходный код модели Stable Diffusion открытый.
Разработчики Stable Diffusion выложили исходный код нейросети на GitHub, любой может скачать файлы программы и запустить её локально на своём устройстве, правда, для этого рекомендуется видеокарта с объёмом памяти около 6 Гб и желательно с тензорными ядрами.
За счёт открытого исходного года Stable Diffusion стала основой для десятка новых проектов, о некоторых из них будет упоминание ниже.
Приложение Lensa – нейросети в массы (ноябрь)
И всё же использование нейросетей долгое время считалось развлечением для гиков. Ведь чтобы сгенерировать действительно что-то стоящее, потребуется потратить достаточно времени времени на поиск «общего языка» с ИИ: как правильно задавать prompt'ы? В какой ситуации какой использовать сэмплер? Поиск лучшего значения CFG Scale, оптимального количества шагов, изучение текстовой инверсии и так далее.
Всё это сложно для простого обывателя, а потому российская команда Prisma Labs решила упростить это всё донельзя и выпустить в своём фоторедакторе Lensa нейросетевую функцию Magic Avatars.
За счёт автоматизированной текстовой инверсии на базе Stable Diffusion фоторедактор Lensa способен в один клик сделать из нескольких снимков пользователя целый набор аватарок в различных стилях. Говоря простым языком, в отличие от других фоторедакторов, Lensa не накладывает фильтры на фото, а полностью их перерисовывает в новом стиле.
Приложение вмиг обрело популярность, и уже в конце ноября многие в соцсетях предстали в образах космонавтов, джентльменов и даже сказочных фей. Уже через полторы недели после запуска приложение стало самым скачиваемым приложением на iOS в России.
Китайская аниме-нейросеть Different Dimension Me (ноябрь 2022)
В конце ноября волну популярности поймала ещё одна нейросеть, на этот раз от китайцев, а именно от соцсети QQ. Me In Comics (или ранее известная как Different Dimension Me) способна за секунды превратить любую фотографию в кадр из аниме, причём работает она очень быстро и точно.
Me In Comics может делать арты не только из портретов людей, она также может отредактировать фотографии животных или пейзажей.
Нейросеть доступна бесплатно на этом сайте. На данный момент у неё нет ограничений на количество генераций, однако она не разрешает загрузить фото политиков.
Восстание людей против роботов (декабрь 2022)
Такая резкая популярность генераторов изображений не могла обойти стороной художников, которые в один момент взбунтовались против нейросетей.
Многие художники считают несправедливым то, что их собственные работы сопоставляются с рисунками нейросетей, поскольку ИИ-алгоритмы, как правило, обучаются на работах реальных художников, которые размещены в интернете. После обучения такие системы успешно копируют большую часть изображений реальных художников и создают на их основе новые работы, выдавая за собственные.
Англоязычная редакция «Кода Дурова» даже решила поговорить с популярными художниками Еленой Шейдлиной и Покрасом Лампасом, чтобы узнать их мнение о перспективах нейросетей в искусстве. О их мыслях и рассуждениях о перспективах художников в мире победившего ИИ можете прочитать здесь.
Компании нашли в нейросетях золотую жилу (декабрь)
Пока нейросети критикуются за потенциальную кражу хлеба у художников, компании видят в них отличное средство заработка. Так, в начале декабря Adobe объявила, что будет продавать изображения, сгенерированные нейросетями, наравне со всеми остальными.
В Adobe были «приятно удивлены», что работы соответствуют всем заданным компанией стандартам качества. В заявлении компания подчеркнула тот факт, что видит будущее, где искусственный интеллект дополняет художников, а не заменяет их. При этом в компании считают, что у обучаемых моделей есть огромный потенциал для создания качественного контента.
NovelAI и утечка исходного кода (октябрь 2022)
Изначально NovelAI базировалась как ИИ-генератор рассказов, однако позднее появилась новая версия нейросети, которая была способна генерировать качественные аниме арты.
Обучена модель была на базе имиджборда Danbooru и работает по платной подписке, однако в начале октября произошла утечка исходного кода NovelAI, в результате которой неизвестный выложил в отрытый доступ полный дамп генератора картинок.
Энтузиасты вмиг научились ставить её локально на базе Stable Diffusion. После этого события NovelAI вовсю захватила тематические форумы художников, вроде pixiv, где сейчас энтузиасты массово делятся артами ИИ, которые по качеству не уступают работам многих художников.
Нельзя сказать наверняка, но возможно утечка кода NovelAI дала толчок другим нейросетям, ведь именно после этого события резко появилась китайская Different Dimension Me, а в Midjourney v4 появился аниме-стиль.