Кодик кратко объясняет суть статьи
Правительство США обязало Anthropic отключить модели Fable 5 и Mythos 5 для всех пользователей из-за соображений национальной безопасности, запретив доступ к ним иностранным гражданам, включая сотрудников компании. В связи с этим Anthropic приостановила работу обеих моделей глобально, хотя доступ к другим своим моделям остался неизменным. Решение последовало после получения директивы 13 июня, в которой не указаны конкретные угрозы, но упоминается обнаруженный метод «джейлбрейка» для Fable 5. Компания проанализировала метод и сочла его малоэффективным, позволяющим выявить лишь известные незначительные уязвимости — аналогичные результаты можно достичь и на общедоступных моделях, включая GPT-5.5. Anthropic отмечает, что модель создавалась не как абсолютно защищённая, но с учётом сложности и обнаруживаемости обходов, и прошла тысячи часов тестирования с участием властей США, британского AISI и других организаций. Компания исполняет предписание, но не согласна с ним, считая, что отозвать коммерческую модель из-за узкого и нестабильного «джейлбрейка» необоснованно — это может остановить развитие всей отрасли. Anthropic намерена опубликовать детали инцидента в течение 24 часов и работает над восстановлением доступа.
Читайте в Telegram
|
Правительство США выпустило директиву об экспортном контроле, обязав Anthropic отключить Fable 5 и Mythos 5 для всех пользователей, говорится в официальном заявлении компании.
Директива запрещает иностранным гражданам — вне зависимости от местонахождения, включая иностранных сотрудников самой Anthropic — доступ к обеим моделям. Чтобы обеспечить соответствие требованию, компания была вынуждена отключить их для всей пользовательской базы. Доступ к остальным моделям Anthropic не затронут.
Соответствующее уведомление отображается и в приложениях Claude.

Документ поступил в компанию в ночь на 13 июня по московскому времени — конкретных деталей об угрозе нацбезопасности в нём не содержалось. По данным Anthropic, власти считают, что им стало известно о методе «джейлбрейка» (обхода ограничений безопасности модели) применительно к Fable 5.
Anthropic изучила продемонстрированный метод и пришла к выводу, что он позволяет обнаружить незначительные, ранее известные уязвимости. По заявлению компании, аналогичные результаты достигаются с помощью общедоступных моделей — в том числе GPT-5.5 от OpenAI.
Сам «джейлбрейк» сводится к просьбе прочитать кодовую базу и исправить программные ошибки — именно так ежедневно работают специалисты по кибербезопасности.
При разработке Fable 5 Anthropic не ставила целью полную неуязвимость к «джейлбрейкам». Вместо этого компания делала ставку на то, чтобы любой обход защиты оставался узким и трудоёмким, а попытки взлома оперативно выявлялись. Перед запуском модель прошла тысячи часов red-team-тестирования совместно с правительством США, британским AISI (Институт безопасности ИИ) и сторонними организациями.
Anthropic выполняет предписание, однако публично с ним не соглашается: по мнению компании, обнаружение узкого нестабильного «джейлбрейка» не должно быть основанием для отзыва коммерческой модели с сотнями миллионов пользователей. Если применять такой стандарт ко всей отрасли, это фактически заморозит выпуск новых моделей у всех разработчиков.
Компания планирует раскрыть подробности инцидента в течение 24 часов и работает над восстановлением доступа.
Ранее «Код Дурова» писал о запуске Fable 5 и Mythos 5. Что особенного в этих моделях:








