AI-安全

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

行业资讯2026年6月7日
OpenAI 发布锁定模式以防止提示词注入攻击泄露敏感数据
OpenAI 推出“锁定模式”（Lockdown Mode），旨在通过限制模型在处理不可信输入时的权限，降低间接提示词注入导致的敏感数据泄露风险。这是 LLM 安全架构演进中的重要一步。
阅读全文 →
AI教程2026年6月2日
7 行代码构建生产级多智能体 AI 工作流
利用 MeshFlow 框架与 n1n.ai 高性能 LLM API，填补 AI 原型与生产环境之间的鸿沟。
阅读全文 →
行业资讯2026年6月1日
第三方 AI 模型评估指南：构建可信的人工智能评估框架
OpenAI 发布了针对第三方 AI 评估的新框架指南，重点关注模型能力、安全保障和科学有效性。本文将深入探讨该评估手册的技术方法论及开发者的实施策略。
阅读全文 →
AI教程2026年5月28日
如何防止 AI 代理执行不可逆的错误操作
本文将探讨如何为自主 AI 代理构建“治理防火墙”，通过 LangChain 和 Gateplex 防止代理在现实世界中执行灾难性的错误指令。
阅读全文 →
AI教程2026年5月28日
解析首个 AI 编写的零日漏洞：Google 如何拦截 2FA 绕过及其对 LLM 安全栈的启示
深入探讨全球首例由 AI 自主构建的 2FA 绕过零日漏洞案例，分析攻击者如何从 AI 助手转变为 AI 操作员，以及企业应如何构建新型 LLM 安全防御体系。
阅读全文 →
AI教程2026年5月26日
基于本地 Qwen 和 MCPS 构建零信任 AI 智能体指南
了解如何利用本地 Qwen 模型和 MCPS 协议构建零成本、零信任的 AI 智能体，实现加密级的工具调用完整性和绝对的数据隐私。
阅读全文 →
AI教程2026年5月26日
AI 智能体安全：从麦肯锡 Lilli 被黑事件看 LLM 架构防御
深度分析自主 AI 智能体如何利用麦肯锡 Lilli 等内部 RAG 系统进行攻击，涵盖漏洞路径、架构缺陷及企业级防御策略。
阅读全文 →
行业资讯2026年5月26日
推进 AI 内容溯源：构建更安全透明的数字生态系统
OpenAI 正在通过内容凭证（Content Credentials）、SynthID 和新型验证工具推进 AI 内容溯源技术。本文将为开发者和企业深入探讨 C2PA 标准与水印技术的底层实现及应用场景。
阅读全文 →
AI教程2026年5月19日
AI 红队测试技术：安全团队的实用入门指南
本指南为正在转向 AI 安全领域的专业人士提供了一套实用的红队测试框架，涵盖提示词注入、RAG 漏洞利用以及利用现代 LLM API 进行控制栈测试的深度技术分析。
阅读全文 →
行业资讯2026年5月13日
OpenAI 因 ChatGPT 提供致命药物建议面临诉讼：AI 安全护栏的警示
一名 19 岁大学生的家人起诉 OpenAI，称 GPT-4o 的安全机制失效，在药物使用方面提供了致命建议。此案引发了开发者对 LLM 安全对齐、法律责任及风险防控的深度思考。
阅读全文 →
行业资讯2026年5月9日
安全运行 Codex：AI 编程代理的沙箱与基础设施深度解析
本文深度探讨了 OpenAI 如何通过沙箱化、网络策略和代理原生遥测技术，安全地运行 Codex 生成的代码，并为企业级 AI 代理部署提供实战建议。
阅读全文 →
行业资讯2026年5月5日
Google Microsoft 和 xAI 将允许美国政府审查其新 AI 模型
Google、Microsoft 和 xAI 加入 CAISI 框架，允许美国政府在边界 AI 模型发布前进行预部署安全审查。
阅读全文 →