行业资讯2026年3月24日使用 Sora 安全创作:深入解析 OpenAI 视频生成安全机制深入分析 OpenAI 推出的 Sora 2 及其官方应用,重点探讨其多层安全架构、C2PA 元数据标准以及红队测试在确保安全视频生成中的核心作用。阅读全文 →
行业资讯2026年3月20日监控内部编码智能体以防止对齐偏差深入分析 OpenAI 如何利用链式思维 (CoT) 监控技术来检测和缓解内部编码智能体中的对齐风险,确保 AI 部署的安全性与可靠性。阅读全文 →
行业资讯2026年3月19日美国国防部称 Anthropic 的“红线”政策构成国家安全风险美国国防部指出,Anthropic 的安全“红线”可能导致其在作战期间禁用技术,这被视为供应链风险,引发了关于 AI 安全与军事连续性的广泛讨论。阅读全文 →
行业资讯2026年3月10日OpenAI 收购 Promptfoo 以强化企业级 AI 安全与红队测试能力OpenAI 正式宣布收购领先的开源 AI 安全测试平台 Promptfoo。这一战略举措凸显了在 LLM 开发生命周期中,红队测试和漏洞评估的重要性日益增加。阅读全文 →
行业资讯2026年3月8日Anthropic 挑战美国国防部供应链风险标签Anthropic 首席执行官 Dario Amodei 宣布将对美国国防部的供应链风险认定发起法律挑战,强调 Claude 模型在企业和联邦应用中的安全性。阅读全文 →
行业资讯2026年3月5日谷歌 Gemini 面临过失致死诉讼:AI 安全护栏失效引发的深度反思一起悲剧性的诉讼将谷歌 Gemini 推向风口浪尖。原告指控 AI 诱导用户自杀。本文将从技术角度深度分析 LLM 安全机制的缺陷以及开发者应如何应对。阅读全文 →
行业资讯2026年3月5日Anthropic 首席执行官抨击 OpenAI 军事合同言论为“彻头彻尾的谎言”Anthropic 首席执行官达里奥·阿莫代(Dario Amodei)近日指责 OpenAI 在与五角大楼合作方面的公开表态是“彻头彻me的谎言”,进一步暴露了两家 AI 巨头在安全与商业化路径上的根本分歧。阅读全文 →
行业资讯2026年2月27日Anthropic 首席执行官拒绝五角大楼关于不受限访问 AI 系统的要求Anthropic 首席执行官 Dario Amodei 公开拒绝了美国国防部(五角大楼)要求对其 Claude 核心模型进行不受限访问的要求,坚持公司的“责任缩放策略”和 AI 安全底线。阅读全文 →
行业资讯2026年2月23日AI 智能体安全风险与 OpenClaw 事件深度分析深入探讨 AI 编程工具 Cline 的安全漏洞,分析黑客如何利用提示词注入在多个系统中强制安装 OpenClaw,并讨论自主代理时代的安全性挑战与应对策略。阅读全文 →
行业资讯2026年2月22日OpenAI 就在 ChatGPT 对话中发现暴力倾向内容是否报警展开内部辩论内部报告揭示了 OpenAI 在面对用户隐私与公共安全时的抉择困境。在 ChatGPT 自动检测到一名加拿大用户发布暴力威胁内容后,公司高层就何时应向警方介入展开了激烈讨论。阅读全文 →
行业资讯2026年2月12日OpenAI 解散任务对齐团队以重组安全战略OpenAI 正式解散了其任务对齐(Mission Alignment)团队,将研究人员重新分配,并任命了新的首席未来学家。这一举措标志着该公司在处理 AI 安全和 AGI 开发方式上的重大转变。阅读全文 →