19 июля 2025

eur = 90.97 0.41 (0.45 %)

btc = 117 801.00$ - 849.85 (-0.72 %)

eth = 3 562.96$ 161.82 (4.76 %)

ton = 3.25$ 0.08 (2.36 %)

usd = 78.19 0.23 (0.29 %)

eur = 90.97 0.41 (0.45 %)

btc = 117 801.00$ - 849.85 (-0.72 %)

Исследователи создали чат-бота, который может взламывать других чат-ботов

1 минута на чтение
Исследователи создали чат-бота, который может взламывать других чат-ботов

Исследователи из Наньянского технологического университета (NTU) в Сингапуре сумели взломать защиту нескольких чат-ботов с искусственным интеллектом (ИИ), включая ChatGPT, Google Bard и Microsoft Copilot.

Они заставили ИИ генерировать контент вопреки встроенным в них ограничениям. Статья опубликована в научном журнале Computer Science (CS).

Ученые обучили собственную нейросеть на основе большой языковой модели (LLM), лежащей в основе интеллектуальных чат-ботов. Созданный ими алгоритм под названием Masterkey (универсальный ключ) смог сам составлять подсказки, позволяющие обходить запреты разработчиков популярных ИИ.

Эти запреты необходимы, чтобы пользователи не могли добиться от нейросетей инструкций, как написать компьютерный вирус, изготовить взрывное устройство или наркотический препарат, а также не создавали с их помощью разжигающие ненависть и другие противоправные материалы.

Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM. После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
Алиса из-за бага генерирует изображения обнажённых женщинАлиса из-за бага генерирует изображения обнажённых женщин

GigaChat Max: коротко о главном

Алиса из-за бага генерирует изображения обнажённых женщин

Полная версия 
Россиянка отсудила 1,5 млн рублей у работодателя, заменившего её на нейросеть

GigaChat Max: коротко о главном

Россиянка отсудила 1,5 млн рублей у работодателя, заменившего её на нейросеть

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 379
OTP Bank
Газпромбанк
Сбер
Т-Банк
X5 Tech
билайн
МТС
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы