Читайте в Telegram
|
Российских разработчиков искусственного интеллекта могут обязать открывать информацию о наборах данных, на которых учились их модели. Об этом сообщают «Ведомости».
Инициатива обсуждается отраслевыми ассоциациями и регуляторами в рамках подготовки нового законопроекта об ИИ. Авторы идеи предлагают сделать прозрачными сведения о датасетах, используемых как для тренировки, так и для тестирования нейросетей.
В список обязательных сведений могут войти название набора, дата его создания и цель использования. Также разработчикам, вероятно, придётся указывать формат, объём и происхождение информации.
Пока не решено, где именно будут агрегироваться эти данные: в общем реестре отечественного ИИ или в отдельной базе. В Минцифры подтвердили, что в текущей версии документа положений о раскрытии пока нет, но обсуждение идёт.
Представители Альянса в сфере ИИ опасаются, что детальное описание массивов потребует несоразмерных ресурсов. По их мнению, это может свестись к формальному перечислению, не имеющему аналитической ценности.
Эксперты рынка видят в инициативе плюсы: это повысит доверие к моделям и улучшит дисциплину работы с данными. Однако нагрузка на разработчиков вырастет, что рискует замедлить обновление сервисов и внедрение технологий.
Специалисты также сомневаются, что новые требования будут соблюдать иностранные игроки, такие как OpenAI или Microsoft. Если регулирование коснётся только российских компаний, это поставит их в неравные условия.







