20-летний администратор паблика «Абстрактный юмор» Артем Чирков научил нейросеть самостоятельно создавать и публиковать мемы. Алгоритм объединяет несколько изображений из популярных сообществ в одно и публикует их на странице проекта. Автор системы рассказал TJ о ее работе, будущем нейросетей и обучении на программиста.
В 2015 году Чирков написал первую версию бота на Python. Он скачивал картинки из популярных сообществ, отрезал верхнюю и нижнюю части, а затем объединял их в одно изображение. Вместе с друзьями Чирков научил алгоритм отправлять картинки в предложенные публикации.
В 2016 году студент сделал из системы четыре скрипта. Один искал картинки и обрезал текст на них, второй помогал избежать слишком частого обращения к «ВКонтакте» через API, третий сохранял изображения из пабликов, а четвертый содержал основной код бота. Система не учитывала контекст, поэтому отбирать мемы для публикации приходилось вручную. Кроме того, бот искал картинки с черно-белым шрифтом Impact, а они начали выходить из оборота.
Автономная работа
Чирков забросил паблик до мая 2018 года, когда нашел способ поставить нейросети на распознавание текста и матанализ на фильтрацию результатов. Раз в неделю система собирает информацию о новых мемах из пабликов «МДК», «Лепра», IGM и «Орленок», анализирует их и сохраняет информацию о зонах с текстом. Затем она ежедневно запускает скрипт, который склеивает зоны и планирует восемь публикаций. Разработчик обучил нейросеть проверять получившийся результат, вручную отобрав тысячу «подходящих и неподходящих» изображений. В итоге проект начал работать полностью автономно.
Для создания структуры системы Чирков использовал готовую нейросеть, которая определяет и оценивает содержание текста. Без нее половина картинок была с нечитаемым текстом, сейчас таких осталось около 5%. Машине чуждо понятие юмора, и мемы имеют смысл только в тех случаях, когда две картинки складываются в шутку. У бота есть свое понимание контекста: он анализирует второстепенные факторы, такие как позиция, размер, цвет, а также умеет отделять сетапы от панчлайнов.
Чирков считает, что его паблик — наглядный пример грядущей автоматизации. По его словам, если можно автоматизировать юмор, то это можно сделать со всеми другими сферами. Со временем алгоритмы научатся понимать контекст и смогут создавать смешные картинки, считает администратор «Абстрактного юмора».
Источник: tproger.ru
Подписывайтесь на «Код Дурова» в Telegram и во «ВКонтакте», чтобы всегда быть в курсе интересных новостей!
Читать первым в Telegram-канале «Код Дурова»