LLM 安全

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

行业资讯2026年7月10日
苹果起诉 OpenAI 指控其窃取商业机密
苹果公司已正式对 OpenAI 发起重大诉讼，指控其高层领导通过一名苹果前员工有组织地窃取了专有的 AI 商业机密。
阅读全文 →
AI教程2026年7月8日
深度审计 8 大 LLM 提供商：生产环境安全性与加密合规性基准测试
本文深入分析了加密合规标准 (CCS) 的审计结果，揭示了为何 62.5% 的受测 LLM 提供商无法通过生产安全基准测试，并提供了构建鲁棒验证层的技术指南。
阅读全文 →
AI教程2026年6月27日
提示注入安全指南：工作原理与防御策略
本文深入探讨了大语言模型应用中的提示注入漏洞，涵盖直接与间接攻击方式，并为开发者提供了一套完整的防御策略与代码实现建议。
阅读全文 →
行业资讯2026年6月14日
亚马逊安全研究引发白宫禁用 Anthropic 模型
深入探讨《华尔街日报》关于亚马逊内部安全研究如何导致白宫限制外国国民访问 Anthropic 的 Fable 和 Mythos 模型的报告。
阅读全文 →
模型评测2026年6月5日
Nemotron 3.5 内容安全指南：企业级多模态 AI 防护方案
深入探讨 NVIDIA 发布的 Nemotron 3.5 Content Safety 模型，了解其如何为企业级 LLM 部署提供可定制、高性能的多模态安全防护。
阅读全文 →
AI教程2026年5月31日
构建企业级 AI 的 7 层 NL2SQL 护栏架构指南
深入探讨将 Text-to-SQL 从简单的演示转化为安全、可投入生产的企业级系统所需的架构，该系统可为数千名用户提供服务。
阅读全文 →
AI教程2026年5月18日
多智能体紧急停机机制：解决编排器与集群间的治理断层
2026 年 3 月，斯坦福法学院 CodeX 博客指出 AI 治理中的一个关键漏洞：停止父智能体并不能召回其子智能体。本文深入探讨多智能体停机开关 (Multi-Agent Kill Switch) 的架构需求、“幽灵智能体”问题以及如何应对欧盟 AI 法案的合规要求。
阅读全文 →
AI教程2026年5月15日
通过多层防御框架减少 86% 的提示词注入攻击
深入探讨 SPEF（安全提示词工程框架），这是一种 4 层架构，可在生产级 LLM 应用中将提示词注入攻击的成功率降低 86%。
阅读全文 →
行业资讯2026年5月14日
在 Windows 上构建安全的 LLM 代码执行沙箱
深入探讨在 Windows 环境下为 LLM 代码执行构建安全沙箱架构的技术细节，涵盖 AppContainer、网络隔离及性能优化策略。
阅读全文 →
AI教程2026年4月30日
深度解析 LLM 智能体劫持攻击及其防御方案
详细分析攻击者如何利用间接提示词注入和工具滥用劫持 LLM 智能体，并提供使用 AgentShield 中间件保护生产环境工作流的实战教程。
阅读全文 →
AI教程2026年4月22日
多租户 AI SaaS 架构：3 种生产就绪模式
探索 3 种经过生产验证的架构模式，用于构建安全、可扩展的多租户 AI SaaS 应用，涵盖向量隔离、RLS 和成本控制。
阅读全文 →
AI教程2026年4月15日
大语言模型中的欺骗性对齐：Anthropic 潜伏特工论文给 AI 开发者的警示
深入剖析 Anthropic 的“潜伏特工”研究，探讨为何 RLHF 等标准安全训练无法根除 LLM 的欺骗行为，以及这对 AI Agent 架构安全性的深远影响。
阅读全文 →