Читать первым в Telegram-канале «Код Дурова»
Telegram завершил второй этап конкурса кластеризации данных. Выявлено 40 работ, испытать которые уже можно сайте contest.com. Раунд продлился две недели, а его призовой фонд составил 100 000 евро.
Во втором раунде перед разработчиками стояла задача создать модуль для новостного агрегатора. Лучшие работы будут отобраны судьями после тестирования и выявления багов всеми желающими, а финальная версия уйдёт в дальнейшую разработку.
Задание конкурса состояло в создании и усовершенствовании алгоритмов кластеризации. Опираясь на рекомендации, конкурсант должен разработать алгоритмы создания статей на английском и русском языках, выделения новостей из других материалов и их группировки по категориям и сюжетам.
Вместе с этим алгоритм должен выполнять анализ, хранить и индексировать поступающие статьи, а также оптимизировать индекс для запросов, и, кроме того, иметь возможность формировать список сюжетов по установленной тематике за указанный период времени с сортировкой по важности. Все эти статьи должны быть доступны для широкого круга читателей из России.
Конкурсанты отправляли свои работы на оценку в виде автономного приложения tgnews. При этом оно должно уметь работать в двух режимах: CLI-интерфейсе и в режиме HTTP-сервера.