模型评测2026年1月28日DeepSeek 震撼发布一周年:重塑全球大模型效率与开源格局深入探讨 DeepSeek 发布一周年以来对 AI 行业的深远影响,分析其 MLA 与 MoE 技术创新,以及如何通过 API 聚合平台高效接入这些模型。阅读全文 →
模型评测2026年1月28日中国开源 AI 生态系统的架构选择:超越 DeepSeek 的创新深入分析中国开源大语言模型(LLM)领域的架构突破,探讨除 DeepSeek 之外,Qwen、Yi 和 InternLM 等模型的独特技术路径。阅读全文 →
行业资讯2026年1月28日月之暗面发布 Kimi k2.5 开源模型与编程助手月之暗面(Moonshot AI)近日推出了全新的 Kimi k2.5 开源模型。该模型基于 15 万亿 token 的海量数据训练,具备强大的多模态处理能力,并同步上线了旨在对标国际顶尖水平的编程助手(Coding Agent)。阅读全文 →
行业资讯2026年1月28日Anthropic 据报将以 3000 亿美元估值融资 200 亿美元AI 初创公司 Anthropic 据报道正在洽谈一笔高达 200 亿美元的新融资,其估值可能达到惊人的 3000 亿美元。这一举动标志着全球 AI 算力与模型竞赛进入了全新的资本密集阶段。阅读全文 →
AI教程2026年1月27日深度 解析 NVIDIA Rubin:面向 智能体 AI 的 下一代 内存 架构本文 深度 探讨 NVIDIA Rubin 平台,解析 HBM4、ICMS 存储 分层 以及 BlueField-4 DPU 如何 突破 万亿 参数 模型 的 内存 壁垒,为 开发者 提供 领先 的 技术 洞察。阅读全文 →
AI教程2026年1月27日Karpathy 的 Claude Code 实践心得:AI 编程时代的深度反思与实战指南深入分析 AI 大神 Andrej Karpathy 关于 Claude Code 的实战记录,探讨从手动编码到 Agent 驱动开发的“相变”过程,以及开发者在 2026 年面临的挑战与机遇。阅读全文 →
模型评测2026年1月27日开启开源大模型的代理强化学习训练:实践回顾本文深入探讨了在开源大模型(GPT-OSS)中实现代理(Agentic)工作流强化学习(RL)的技术细节,涵盖 GRPO 算法、奖励模型设计及基础设施优化。阅读全文 →
行业资讯2026年1月27日Anthropic 发布 Claude 交互式应用,支持 Slack 及多种办公工具集成Anthropic 通过推出交互式应用和深度办公工具集成,扩展了 Claude 的功能,允许用户直接在 Slack 等工具中执行复杂任务。阅读全文 →
行业资讯2026年1月27日微软发布自研 Maia AI 推理芯片 1000 亿晶体管助力性能飞跃微软推出新一代自研 AI 推理芯片 Maia,集成超过 1000 亿个晶体管,在 4-bit 精度下可提供 10 Petaflops 的算力,旨在大幅降低大模型推理成本并提升响应速度。阅读全文 →
AI教程2026年1月27日vLLM 深度解析:PagedAttention 如何让大模型推理更快、更省钱深入探讨 vLLM 如何通过 PagedAttention 技术解决 GPU 显存碎片化问题,并显著提升大语言模型(LLM)的推理吞吐量。阅读全文 →
AI教程2026年1月27日深度解析 Cursor 如何索引你的代码库:RAG 技术的实践深入探讨 Cursor IDE 的 RAG 流水线,包括 Tree-sitter 解析、向量嵌入以及针对 AI 辅助编程优化的混合检索策略。阅读全文 →