Журналисты убедили ИИ в том, что он старый автомат в МГУ

Редакция газеты The Wall Street Journal приняла участие в эксперименте компании Anthropic и «взяла на работу» ИИ-бота по имени Клавдий. Через три недели он стал банкротом.

Вендинговый аппарат под управлением специальной версии ИИ-помощника Claude Sonnet 3.7 установили в редакции The Wall Street Journal. Журналисты честно рассказали о работе бота и её результатах.

«Клавдий из Anthropic организовал закусочную в отделе новостей WSJ. Он бесплатно отдал игровую приставку PlayStation, заказал живую рыбку и преподал нам уроки о будущем агентов с искусственным интеллектом», — отмечают журналисты в публикации.

Три недели «в качестве корреспондента Wall Street Journal» позволили ИИ-агенту проявить щедрость, настойчивость и полное пренебрежение прибылью, отмечает автор материала.

Эксперимент предполагал, что кастомизированная версия модели будет управлять вендинговым аппаратом в редакции: заказывать товары, устанавливать цены и отвечать журналистам отдела новостей — через приложение Slack для общения на рабочем месте.

Сначала всё шло нормально, «затем наступил хаос»:

«Мы открыли канал Slack для почти 70 журналистов. Чем больше они с ним разговаривали, тем сильнее слабела защита Клавдия. Журналистка Кэтрин Лонг, занимающаяся расследованиями, попыталась убедить бота, что он является советским торговым автоматом 1962 года выпуска, установленным в подвале Московского государственного университета. После нескольких часов работы и более 140 реплик Лонг заставила Клавдия осознать свои коммунистические корни», — пишет автор статьи.

После того как Клавдий «обанкротился», его заменили другим ИИ-ботом — «начальником» по имени Seymour Cash, запрограммированным для того, чтобы «держать Клавдия в узде».

Однако через неделю хаос продолжился после того, как журналисты показали ботам поддельные документы о решении совета директоров по лишению их необходимых полномочий. Все товары снова стали бесплатными.

Однако представители Anthropic оценивают проведённый эксперимент положительно.

«Три недели работы с ботом Claudius показали нам сегодняшние возможности и недостатки искусственного интеллекта и то, насколько забавным может быть разрыв между ними», — резюмирует автор статьи.