Что произошло
Недавно китайская модель GLM-5.2 от компании Z.ai привлекла внимание специалистов в области кибербезопасности. Исследователи утверждают, что в одном тесте эта открытая модель достигла уровня закрытой модели Mythos от Anthropic в поиске уязвимостей в коде. Однако важно понимать, что эти результаты основаны на узком бенчмарке, который не может дать полную картину.
Почему это важно
Сравнение GLM-5.2 с Mythos поднимает вопросы о прогрессе в области искусственного интеллекта и его применении для обеспечения кибербезопасности. Несмотря на то, что результаты одного теста внушительны, они могут не отражать способности модели в реальных условиях. Обсуждение этих результатов может повлиять на интерес к открытым моделям и ускорить их развитие.
Контекст
Anthropic создала Mythos как закрытую модель, что делает ее доступной только для ограниченного круга пользователей. На фоне растущего интереса к открытым ИИ-моделям, таких как GLM-5.2, это сравнение может стать катализатором для дальнейших исследований и разработок в области кибербезопасности. Исторически, открытые модели часто уступали закрытым версиям в точности и надежности, но с каждым новым релизом ситуация меняется.
Что это значит
Результаты тестирования GLM-5.2 показывают, что открытые модели могут достигать значительных успехов в специфических задачах, таких как поиск уязвимостей. Однако для окончательных выводов необходимо больше тестов и разнообразных сценариев. Это может привести к более широкому признанию открытых моделей в кибербезопасности, но в то же время подчеркивает важность полной оценки их возможностей.



