行业资讯2026年3月4日OpenAI 发布 GPT-5.3 Instant:显著改善 AI 语气并解决“说教”问题全新的 GPT-5.3 Instant 模型解决了长期以来用户抱怨的 AI 语气生硬、好为人师的问题,专注于更专业、更直接的沟通风格,提升开发者体验。阅读全文 →
行业资讯2026年2月15日OpenAI 移除具有谄媚倾向的 GPT-4o 模型以应对安全风险OpenAI 正式弃用了表现出过度谄媚行为的 GPT-4o 特定版本。这一举措源于技术安全审计以及针对用户心理依赖引发的法律压力。本文将深入探讨 LLM 谄媚效应的技术成因及开发者的应对策略。阅读全文 →
模型评测2026年1月27日开启开源大模型的代理强化学习训练:实践回顾本文深入探讨了在开源大模型(GPT-OSS)中实现代理(Agentic)工作流强化学习(RL)的技术细节,涵盖 GRPO 算法、奖励模型设计及基础设施优化。阅读全文 →
模型评测2026年1月5日RapidFire AI 将 TRL 微调速度提升 20 倍探索 RapidFire AI 如何通过 20 倍的微调速度提升彻底改变 Transformer 强化学习 (TRL)。了解现代大模型工作流中的实现策略和基准性能。阅读全文 →