Telegram запустил второй этап конкурса Data Clustering Contest на создание модуля, на базе которого может быть запущен агрегатор новостей. К участию допускаются все желающие, в том числе те, кто пропустил предыдущий этап.
Участники конкурса, опираясь на рекомендации, должны создать или усовершенствовать существующие алгоритмы кластеризации для выделения статей и новостей на английском и русском языках, в том числе из других материалов, а также их группировки по категориям и сюжетам.
Алгоритм должен анализировать, хранить и индексировать поступающие статьи, а также формировать список сюжетов по указанной тематике за указанный период времени, отсортированный по важности. При этом сюжеты на русском должны быть актуальны для читателя из России, а сюжеты на английском — для широкого круга международных читателей.
Работы будут приниматься в виде standalone приложения tgnews. Приложение должно запускаться как в CLI-интерфейсе, так и в режиме HTTP/1.1 сервера с поддержкой Keep-Alive.
Второй этап продлится две недели, а его призовой фонд составляет €100,000.
Читать первым в Telegram-канале «Код Дурова»