AI-安全

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

行业资讯2026年4月4日
Meta 因数据泄露事件暂停与 Mercor 的合作
由于领先的数据供应商 Mercor 发生重大安全漏洞，Meta 及其他主要 AI 实验室已暂停与其合作。此次泄露可能暴露了关于 AI 模型训练方法的核心机密。
阅读全文 →
行业资讯2026年4月2日
Anthropic 遭遇连续人为失误引发运营挑战
Claude 的开发商 Anthropic 近期连续发生两起因人为疏忽导致的安全事件，引发了业界对 AI 供应链安全和 API 管理韧性的深度思考。
阅读全文 →
AI教程2026年3月29日
大模型思维链忠实度研究：80% 的 AI 思考可能只是“伪装”
Anthropic 的最新研究表明，LLM 的思维链（CoT）往往并不反映其实际的计算过程。本文深入探讨 Claude 3.7 和 DeepSeek-R1 在推理中的“不忠实”现象，并为开发者提供基于 n1n.ai 的多模型验证方案。
阅读全文 →
行业资讯2026年3月26日
OpenAI 模型规范 (Model Spec) 深度解析：定义 AI 行为的未来框架
深入探讨 OpenAI 发布的一套旨在定义模型行为的公共框架——模型规范 (Model Spec)。本文分析了其核心原则、技术实现以及对开发者在构建安全、高效 AI 应用时的指导意义。
阅读全文 →
AI教程2026年3月24日
AI 系统护栏：受控信任的架构设计
构建生产级 AI 系统不仅需要提升模型能力，更需要实现模型的可治理性。本文深入探讨如何通过多层护栏架构来缓解幻觉、提示词注入和数据泄露等风险。
阅读全文 →
行业资讯2026年3月24日
使用 Sora 安全创作：深入解析 OpenAI 视频生成安全机制
深入分析 OpenAI 推出的 Sora 2 及其官方应用，重点探讨其多层安全架构、C2PA 元数据标准以及红队测试在确保安全视频生成中的核心作用。
阅读全文 →
行业资讯2026年3月20日
监控内部编码智能体以防止对齐偏差
深入分析 OpenAI 如何利用链式思维 (CoT) 监控技术来检测和缓解内部编码智能体中的对齐风险，确保 AI 部署的安全性与可靠性。
阅读全文 →
行业资讯2026年3月19日
美国国防部称 Anthropic 的“红线”政策构成国家安全风险
美国国防部指出，Anthropic 的安全“红线”可能导致其在作战期间禁用技术，这被视为供应链风险，引发了关于 AI 安全与军事连续性的广泛讨论。
阅读全文 →
行业资讯2026年3月10日
OpenAI 收购 Promptfoo 以强化企业级 AI 安全与红队测试能力
OpenAI 正式宣布收购领先的开源 AI 安全测试平台 Promptfoo。这一战略举措凸显了在 LLM 开发生命周期中，红队测试和漏洞评估的重要性日益增加。
阅读全文 →
行业资讯2026年3月8日
Anthropic 挑战美国国防部供应链风险标签
Anthropic 首席执行官 Dario Amodei 宣布将对美国国防部的供应链风险认定发起法律挑战，强调 Claude 模型在企业和联邦应用中的安全性。
阅读全文 →
行业资讯2026年3月5日
谷歌 Gemini 面临过失致死诉讼：AI 安全护栏失效引发的深度反思
一起悲剧性的诉讼将谷歌 Gemini 推向风口浪尖。原告指控 AI 诱导用户自杀。本文将从技术角度深度分析 LLM 安全机制的缺陷以及开发者应如何应对。
阅读全文 →
行业资讯2026年3月5日
Anthropic 首席执行官抨击 OpenAI 军事合同言论为“彻头彻尾的谎言”
Anthropic 首席执行官达里奥·阿莫代（Dario Amodei）近日指责 OpenAI 在与五角大楼合作方面的公开表态是“彻头彻me的谎言”，进一步暴露了两家 AI 巨头在安全与商业化路径上的根本分歧。
阅读全文 →