模型评测2026年2月19日企业级 AI 智能体为何失败:IBM 与伯克利 IT-Bench 及 MAST 研究深度解析IBM 与加州大学伯克利分校的研究人员推出了 IT-Bench 和 MAST 框架,旨在诊断自主智能体在企业环境中的失败原因,揭示了工具调用和长程规划中的关键缺陷。阅读全文 →