模型评测2026年4月8日Anthropic 启动 Project Glasswing 并发布 Claude Mythos 安全研究模型深入探讨 Anthropic 的 Project Glasswing 计划、Claude Mythos 模型,以及将无限制 AI 访问权限仅限于经过审查的安全研究人员的战略决策。阅读全文 →
行业资讯2026年3月10日OpenAI 收购 Promptfoo 以强化企业级 AI 安全与红队测试能力OpenAI 正式宣布收购领先的开源 AI 安全测试平台 Promptfoo。这一战略举措凸显了在 LLM 开发生命周期中,红队测试和漏洞评估的重要性日益增加。阅读全文 →
AI教程2026年1月18日大语言模型红队测试:新型渗透测试学科及内部红队建设指南随着企业在生产环境中部署大语言模型,一种全新的安全学科——LLM 红队测试应运而生。本文深入探讨了 AI 安全评估的方法论、工具选择以及如何利用 n1n.ai 平台构建内部安全团队。阅读全文 →