Читайте в Telegram
|
Команда сервиса TGPages представила «Атлас Telegram» — интерактивную карту, визуализирующую экосистему из 500 тысяч публичных каналов мессенджера.
Проект позволяет пользователям находить новые интересные каналы, а создателям контента и брендам — анализировать структуру рынка и искать ниши. Карта построена по принципу семантической близости: каналы со схожим контентом расположены рядом, образуя тематические «архипелаги» и «галактики».
Карта доступна по этой ссылке.

Для создания карты команда собрала данные о 600 тысячах каналов из открытых источников и собственной базы, затем отфильтровала их до 500 тысяч подходящих для анализа. Используя модель OpenAI text-embedding-3-small, разработчики сгенерировали эмбеддинги для названий, описаний и текстов постов каждого канала. Для обработки такого объёма данных была построена распределённая система на AWS Lambda с воркерами в 17 регионах, что заняло 2-3 дня работы.
Каналы разделены на два уровня категорий: макрокатегории охватывают широкие области вроде «Новости», «Развлечения» и «Спорт», а микрокатегории представляют узкие ниши — от «Разработки игр и геймдизайна» до «Кожевенного мастерства». Для кластеризации использовались алгоритмы UMAP и HDBSCAN, которые автоматически группировали каналы по плотности данных. Названия категорий генерировались с помощью GPT-5.2, а визуализация выполнена алгоритмом t-SNE для проекции многомерных данных на двухмерную карту.








