Китайские открытые ИИ приблизились к моделям Anthropic в задачах кибербезопасности

Кодик кратко объясняет суть статьи
Открытые китайские ИИ-модели, такие как GLM-5.2 от Zhipu AI и Tulongfeng от 360 Security, достигли уровня самых мощных моделей Anthropic — Mythos и Fable 5 — в отдельных задачах кибербезопасности. Специалисты из Semgrep отмечают, что GLM-5.2 превзошла Claude Opus 4.8 в поиске уязвимостей, а с расширенными инструкциями способна конкурировать с Mythos и Fable 5. Важное преимущество GLM-5.2 — возможность локального запуска, в отличие от ограниченного доступа к моделям Anthropic, доступ к которым контролируется властями США. Однако в целом по производительности и интеллектуальным показателям GLM-5.2 уступает ведущим западным моделям, таким как GPT-5.5 и Gemini 3.1 Pro, занимая четвёртое и шестое места соответственно. Тем не менее, модель входит в топ-10 по популярности на платформе OpenRouter.
Читайте в Telegram
|
Открытые китайские ИИ-модели приблизились к самым мощным моделям Anthropic в отдельных задачах кибербезопасности.
Как пишет The Wall Street Journal, выпущенная в середине июня компанией Zhipu AI модель GLM-5.2, веса которой выложили в открытый доступ, в некоторых сценариях кибербезопасности сравнялась по эффективности с Mythos от Anthropic. Это примечательно на фоне того, что доступ к Mythos власти США разрешили лишь избранным американским компаниям, а её открытую версию Fable 5 с теми же весами и вовсе заблокировали для иностранных пользователей.

Оценку приводят специалисты по кибербезопасности из компании Semgrep (Сан-Франциско), тестировавшие GLM-5.2 на своих задачах. По их словам, в поиске уязвимостей модель «превзошла» Claude Opus 4.8 от Anthropic, а с использованием расширенных инструкций «может сравняться» с моделями класса Mythos — то есть с самими Mythos 5 и Fable 5. Ключевое преимущество китайской модели в том, что её можно не только использовать через API и чат, но и запустить локально на собственном компьютере, тогда как доступ к моделям Anthropic ограничен.

При этом речь идёт именно об узком сценарии, а не о превосходстве в целом. В тестах независимой исследовательской компании Artificial Analysis на общую производительность и «интеллект» GLM-5.2 занимает лишь четвёртое место — после GPT-5.5 от OpenAI, а в программировании она шестая, уступая в том числе Gemini 3.1 Pro от Google. Тем не менее модель входит в десятку самых популярных в агрегаторе OpenRouter, через который разработчики подключают разные нейросети.

По информации WSJ, с моделями класса Mythos сопоставим и ещё один китайский инструмент — Tulongfeng от компании 360 Security, специализирующейся на кибербезопасности; на каких моделях он работает, не уточняется.






