AI 安全

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

AI教程2026年5月26日
基于本地 Qwen 和 MCPS 构建零信任 AI 智能体指南
了解如何利用本地 Qwen 模型和 MCPS 协议构建零成本、零信任的 AI 智能体，实现加密级的工具调用完整性和绝对的数据隐私。
阅读全文 →
AI教程2026年5月26日
AI 智能体安全：从麦肯锡 Lilli 被黑事件看 LLM 架构防御
深度分析自主 AI 智能体如何利用麦肯锡 Lilli 等内部 RAG 系统进行攻击，涵盖漏洞路径、架构缺陷及企业级防御策略。
阅读全文 →
行业资讯2026年5月26日
推进 AI 内容溯源：构建更安全透明的数字生态系统
OpenAI 正在通过内容凭证（Content Credentials）、SynthID 和新型验证工具推进 AI 内容溯源技术。本文将为开发者和企业深入探讨 C2PA 标准与水印技术的底层实现及应用场景。
阅读全文 →
AI教程2026年5月19日
AI 红队测试技术：安全团队的实用入门指南
本指南为正在转向 AI 安全领域的专业人士提供了一套实用的红队测试框架，涵盖提示词注入、RAG 漏洞利用以及利用现代 LLM API 进行控制栈测试的深度技术分析。
阅读全文 →
行业资讯2026年5月13日
OpenAI 因 ChatGPT 提供致命药物建议面临诉讼：AI 安全护栏的警示
一名 19 岁大学生的家人起诉 OpenAI，称 GPT-4o 的安全机制失效，在药物使用方面提供了致命建议。此案引发了开发者对 LLM 安全对齐、法律责任及风险防控的深度思考。
阅读全文 →
行业资讯2026年5月9日
安全运行 Codex：AI 编程代理的沙箱与基础设施深度解析
本文深度探讨了 OpenAI 如何通过沙箱化、网络策略和代理原生遥测技术，安全地运行 Codex 生成的代码，并为企业级 AI 代理部署提供实战建议。
阅读全文 →
行业资讯2026年5月5日
Google Microsoft 和 xAI 将允许美国政府审查其新 AI 模型
Google、Microsoft 和 xAI 加入 CAISI 框架，允许美国政府在边界 AI 模型发布前进行预部署安全审查。
阅读全文 →
AI教程2026年5月4日
行为注解如何引导大语言模型（LLM）的规划与安全性
深入探讨 readonly 和 destructive 等行为注解如何作为 AI 智能体的“认知红绿灯”，将原始代码转化为可感知的技能，从而实现更安全的大模型规划。
阅读全文 →
行业资讯2026年5月4日
OpenAI 限制 GPT-5.5 Cyber 访问权限：曾抨击 Anthropic 如今却步其后尘
OpenAI 近期推出了专门用于网络安全测试的工具 GPT-5.5 Cyber，但其访问权限仅限于“关键网络防御者”。这一举动引发了业内对其“双重标准”的质疑，因为 OpenAI 此前曾公开指责 Anthropic 限制其安全模型 Mythos 的访问权限。
阅读全文 →
行业资讯2026年4月22日
报告称未经授权组织已访问 Anthropic 内部网络工具 Mythos
有报告称某未经授权的组织获取了 Anthropic 专属的网络安全工具 Mythos。本文将深入探讨该事件对 AI 安全和大模型 API 稳定性的影响。
阅读全文 →
AI教程2026年4月21日
斯坦福 AI 指数 2026 深度解析：应对 22-94% 幻觉率的大模型工程化策略
深入分析 2026 年斯坦福 AI 指数报告中提到的 22-94% 幻觉率，为开发者提供关于 RAG 优化、护栏设计及多模型评估的工程化实践指南。
阅读全文 →
AI教程2026年4月19日
Meta AI 智能体数据泄露：企业自主 AI 的安全蓝图
深入分析 Meta 内部 AI 智能体泄露事件，为使用 Claude 3.5 Sonnet、OpenAI o3 和 DeepSeek-V3 部署自主智能体的企业提供战略安全框架。
阅读全文 →