行业资讯2026年2月9日Moltbook 数据泄露与不断演进的 AI 安全格局深入分析 AI 智能体社交网络 Moltbook 的安全失败案例,探讨真实用户数据泄露的原因,并结合 Apple 的锁定模式和 Starlink 的地缘政治动态,分析 AI 时代的隐私保护策略。阅读全文 →
AI教程2026年2月7日机械可解释性:深度拆解大语言模型的认知逻辑 (Mechanistic Interpretability)深入探讨 AI 安全与透明度的前沿领域:机械可解释性。了解研究人员如何解码 Claude 3.5 Sonnet 和 DeepSeek-V3 等模型的内部运作机制,揭示它们如何“思考”。阅读全文 →
AI教程2026年2月5日内存投毒威胁:AI 智能体 4 小时内 87% 被攻陷的深度解析最新研究显示,内存投毒可以在短短四小时内渗透 AI 智能体 87% 的决策过程。本文将深入探讨这一静默威胁的原理及应对策略。阅读全文 →
AI教程2026年2月3日LLM 提示词注入攻击:开发者构建 AI 应用的完整安全指南深入探讨大语言模型(LLM)中的提示词注入漏洞,涵盖直接与间接攻击、RAG 投毒以及针对现代 AI 应用的生产级防御策略。阅读全文 →
AI教程2026年2月3日Moltbook 泄露深度分析:150 万 API 密钥因 Supabase 配置错误暴露深入分析 Moltbook 安全漏洞:由于 Supabase 缺少行级安全性 (RLS) 配置,导致 150 万个 API 密钥、代理私信和用户数据遭到泄露。阅读全文 →
行业资讯2026年1月29日AI 智能体点击链接时的隐私安全防护机制深入探讨 OpenAI 如何通过沙箱化、URL 过滤和隔离浏览技术,防止 AI 智能体在访问网页时发生数据泄露和提示词注入攻击。阅读全文 →
行业资讯2026年1月22日Anthropic 首席执行官在达沃斯抨击英伟达及美国芯片出口政策Anthropic 首席执行官 Dario Amodei 在达沃斯论坛上发表重磅言论,公开批评美国政府及英伟达等芯片巨头对华出口政策,引发了关于 AI 安全、硬件供应链与国家安全的深度讨论。阅读全文 →
行业资讯2026年1月20日为什么风险投资正大举押注 AI 安全与影子 AI 治理随着自主智能体和影子 AI 成为企业风险,VC 正在向 Witness AI 等安全初创公司投入巨资,以确保下一代 LLM 部署的安全与合规。阅读全文 →
行业资讯2026年1月15日微软 Copilot 遭遇单次点击隐蔽多阶段攻击安全研究人员演示了一种针对微软 Copilot 的复杂多阶段攻击,该攻击能够从聊天记录中窃取数据,甚至在用户关闭聊天窗口后依然有效。阅读全文 →
行业资讯2026年1月12日美国民主党议员敦促苹果和谷歌从应用商店移除 X 及其 AI 脱衣机器人美国多位民主党参议员正式致信苹果和谷歌,要求其应用商店下架 X 平台。原因是 X 的 AI 聊天机器人 Grok 被指控可以生成非自愿的女性及未成年人色情图像,严重违反了应用商店的安全准则。阅读全文 →
AI教程2026年1月7日概率多变体推理 (PMVR):量化 LLM 不确定性并提升决策质量深入探讨如何超越确定性的 LLM 输出,利用概率多变体推理(PMVR)量化不确定性,并在人机协作中提升决策质量。阅读全文 →
模型评测2026年1月5日AprielGuard 安全框架:提升 LLM 对抗性鲁棒性与防御提示词注入本文深度解析了 AprielGuard 安全框架,探讨其如何通过对抗性鲁棒性技术保护大语言模型免受提示词注入和恶意攻击,并指导开发者如何结合 n1n.ai API 聚合平台进行高效集成。阅读全文 →