IBM без согласия людей использовала их фото из Flickr для обучения систем распознавания лиц
Компания IBM использовала около миллиона фотографий из фотохостинга Flickr для обучения алгоритмов распознавания лиц. Со своей базой данной американская поделилась с другими исследователями, однако люди, кому принадлежат фотографии — не давали согласия на это.
Журналисты NBC углубись в детали создания базы данных IBM, состоящей из около миллиона фотографий. В компании заявляли, что для её разработки помогают снизить предвзятость в технологиях распознавания лиц. Оказалось, что IBM для своих целей взяла фото из базы данных, в которой загружено примерно 99 миллионов фотографий.
Базу, которую использовала IBM, разрабатывал бывший владелец Flickr, — компания Yahoo. Все снимки были переданы американской компании по лицензиям Creative Commons: они позволяют свободно пользоваться фотографиями, однако не учитывают использование снимков для обучения алгоритмов распознавания.
Доступ к портретам для обучения искусственного интеллекта получат только проверенные пользователи, — заявили в IBM.
В разговоре с журналистами NBC некоторые фотографы заявили, что люди с фотографий, которые использует IBM для обучения систем распознавания лиц, даже не догадываются о том, что их снимки используются для этих целей:
Никто из людей, которых я фотографировал, не подозревает, что их снимки используются таким образом, — заявил Грег Певерилл-Конти, руководитель отдела связей с общественностью из Бостона.
Эксперты уверяют, что такая деятельность американской компании нарушает право на неприкосновенность частной жизни людей, — в данном случае речь о миллионах людей с разных уголков мира. Тем не менее, в IBM не считают свою деятельность нарушением прав людей: чтобы технология распознавания лиц работала совершенно — алгоритмы должны получать сотни тысяч изображений разнообразных массивов лиц, которые классифицируются по возрасту, полу, тону кожи и десяткам других метрик.
В американской компании уверяют, что пользователи Flickr могут спокойно удалить свои фото из базы данных. Отсюда возникает другая проблема: чтобы удалить свою фотографию, пользователю нужно прислать ссылки на снимки.
На текущий момент IBM не представила список всех фотографий, которые используются для обучения систем распознавания, поэтому невозможно узнать, чьи снимки попали в базу компании. Единственное, что можно проверить — добавлен ли чей-то аккаунт Flickr в базу IBM: для этого NBC создала соответствующий инструмент.
Читать первым в Telegram-канале «Код Дурова»