AI教程2026年2月17日LLM 架构详解:从 Transformer 到推理模型2026 年大型语言模型 (LLM) 架构深度指南,涵盖 Transformer 基础、RLVR 推理革命、混合专家模型 (MoE) 以及如何根据业务需求选择最佳架构。阅读全文 →
AI教程2026年2月4日深度理解大语言模型:Andrej Karpathy 教程的 63 个核心问答本文深度总结了 Andrej Karpathy 长达 3.5 小时的 LLM 教程,涵盖预训练、后训练、RLHF 以及 AI 智能体等核心技术要点。阅读全文 →
模型评测2026年1月27日开启开源大模型的代理强化学习训练:实践回顾本文深入探讨了在开源大模型(GPT-OSS)中实现代理(Agentic)工作流强化学习(RL)的技术细节,涵盖 GRPO 算法、奖励模型设计及基础设施优化。阅读全文 →
AI教程2026年1月19日DeepSeek R1 技术报告深度解析:从 22 页到 86 页的蜕变DeepSeek 最近将其 R1 技术论文从 22 页更新到了 86 页,在没有任何官方公告的情况下,详细披露了其多阶段训练流水线、中间检查点以及失败的实验细节。这一更新预示着 DeepSeek-V4 的到来,并为开发者提供了宝贵的训练洞察。阅读全文 →