1 мая 2026

eur = 88.64 0.87 (0.99 %)

btc = 77 138.00$ 1 210.48 (1.59 %)

eth = 2 283.58$ 28.99 (1.29 %)

ton = 1.34$ 0.02 (1.76 %)

usd = 74.80 -0.08 (-0.11 %)

eur = 88.64 0.87 (0.99 %)

btc = 77 138.00$ 1 210.48 (1.59 %)

Исследователи создали крупнейший в мире датасет для умных касс и систем учета магазинов

1 минута на чтение
Изображение: круг с бананом и прямоугольник с листом салата.

Кодик кратко объясняет суть статьи

Инженеры Яндекса совместно с учёными из Сколтеха и ГУАП создали крупнейший в мире открытый датасет PackEat для компьютерного зрения в ритейле. В набор вошли фотографии 34 видов и 65 сортов фруктов и овощей, снятых в реальных условиях магазинов. Датасет содержит около 100 тысяч изображений и разметку почти 9 тысяч снимков, включая данные о количестве и весе товаров. Его использование позволит значительно повысить точность распознавания продуктов в кассовых системах и системах учёта, автоматизировать идентификацию товаров и снизить убытки от ошибок ручного контроля. Результаты исследований опубликованы в журнале Scientific Data, а сами материалы размещены на платформах Zenodo и Kaggle.

Читайте в Telegram

|

Инженер Яндекса, исследователи Центра искусственного интеллекта Сколтеха и Санкт-Петербургского государственного университета аэрокосмического приборостроения (ГУАП) представили самый большой в мире открытый набор данных PackEat для систем компьютерного зрения в розничной торговле.

Это набор фотографий фруктов и овощей, который ритейлеры могут использовать для обучения алгоритмов в умных кассах и системах учета. С помощью датасета можно значимо улучшить точность распознавания продуктов в реальных супермаркетах – он учитывает изображения объектов с полиэтиленовыми пакетами, пересечением объектов и «шумным» фоном на прилавках.

Для датасета PackEat команда собрала изображения 34 видов и 65 сортов фруктов и овощей. Это привычные для покупателей товары с овощных и фруктовых прилавков, снятые с разных точек обзора в реальных магазинах. Было собрано свыше 100 тысяч снимков более 370 тысяч отдельных объектов в магазинах разных городов. Около 9 тысяч изображений содержат разметку каждого отдельного объекта, для каждого снимка указано количество объектов и общий вес упаковки. Этот набор данных является крупнейшем в мире и поможет решать ключевые задачи компьютерного зрения в ритейле: различать виды и сорта продуктов, выделять каждый объект отдельно даже, когда они пересекаются или частично закрыты, а также автоматически подсчитывать количество единиц товара.

В розничных сетях сохраняется проблема ручной идентификации видов, сортов и дефектов весового товара (фрукты, овощи), что приводит к убыткам. Исследования показывают: нейросети могут достичь 92% точности, подтверждая важность автоматизации.

Статья с описанием датасета опубликована в открытом доступе в журнале Scientific Data. Набор изображений размещён на платформе Zenodo, а код и примеры моделей — на платформе Kaggle, что позволяет исследователям и разработчикам сразу использовать их в своих проектах и сравнивать получающиеся решения с результатами авторов.

Теги:
Материал обновлен|
Обсудить
Блоги 525
ВКонтакте
OTP Bank
ВТБ
ЦНИС
Слетать.ру
билайн
Т-Банк
Газпромбанк
МТС
X5 Tech

Привет, это Кодик! Я создан, чтобы помогать вам с  разными задачами. Задайте мне вопрос…