9 декабря 2025

eur = 88.70 -1.20 (-1.33 %)

btc = 90 122.00$ -1 236.64 (-1.35 %)

eth = 3 102.69$ -4.14 (-0.13 %)

ton = 1.61$ -0.02 (-1.18 %)

usd = 76.09 -0.88 (-1.14 %)

eur = 88.70 -1.20 (-1.33 %)

btc = 90 122.00$ -1 236.64 (-1.35 %)

Исследователи создали чат-бота, который может взламывать других чат-ботов

1 минута на чтение
Исследователи создали чат-бота, который может взламывать других чат-ботов

Исследователи из Наньянского технологического университета (NTU) в Сингапуре сумели взломать защиту нескольких чат-ботов с искусственным интеллектом (ИИ), включая ChatGPT, Google Bard и Microsoft Copilot.

Они заставили ИИ генерировать контент вопреки встроенным в них ограничениям. Статья опубликована в научном журнале Computer Science (CS).

Ученые обучили собственную нейросеть на основе большой языковой модели (LLM), лежащей в основе интеллектуальных чат-ботов. Созданный ими алгоритм под названием Masterkey (универсальный ключ) смог сам составлять подсказки, позволяющие обходить запреты разработчиков популярных ИИ.

Эти запреты необходимы, чтобы пользователи не могли добиться от нейросетей инструкций, как написать компьютерный вирус, изготовить взрывное устройство или наркотический препарат, а также не создавали с их помощью разжигающие ненависть и другие противоправные материалы.

Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM. После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Читать первым в Telegram-канале «Код Дурова»

Сейчас читают
Что ты такое, iPhone Air?
Что ты такое, iPhone Air?
[ Обзор ]

Что ты такое, iPhone Air?

Внезапные выводы про батарею спустя неделю

Фото Микк Сид
Микк Сид
Новости
Карьера
Блоги 459
OTP Bank
билайн
Газпромбанк
Т-Банк
МТС
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы