LLM-API

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

AI教程2026年1月28日
使用递归语言模型工作流分析海量数据集
探索如何通过递归摘要和 Map-Reduce 模式克服上下文窗口限制，利用 LLM 处理数百万 Token 的实用方法。
阅读全文 →
模型评测2026年1月28日
DeepSeek 震撼发布一周年：重塑全球大模型效率与开源格局
深入探讨 DeepSeek 发布一周年以来对 AI 行业的深远影响，分析其 MLA 与 MoE 技术创新，以及如何通过 API 聚合平台高效接入这些模型。
阅读全文 →
模型评测2026年1月28日
中国开源 AI 生态系统的架构选择：超越 DeepSeek 的创新
深入分析中国开源大语言模型（LLM）领域的架构突破，探讨除 DeepSeek 之外，Qwen、Yi 和 InternLM 等模型的独特技术路径。
阅读全文 →
行业资讯2026年1月28日
月之暗面发布 Kimi k2.5 开源模型与编程助手
月之暗面（Moonshot AI）近日推出了全新的 Kimi k2.5 开源模型。该模型基于 15 万亿 token 的海量数据训练，具备强大的多模态处理能力，并同步上线了旨在对标国际顶尖水平的编程助手（Coding Agent）。
阅读全文 →
行业资讯2026年1月28日
Anthropic 据报将以 3000 亿美元估值融资 200 亿美元
AI 初创公司 Anthropic 据报道正在洽谈一笔高达 200 亿美元的新融资，其估值可能达到惊人的 3000 亿美元。这一举动标志着全球 AI 算力与模型竞赛进入了全新的资本密集阶段。
阅读全文 →
AI教程2026年1月27日
深度解析 NVIDIA Rubin：面向智能体 AI 的下一代内存架构
本文深度探讨 NVIDIA Rubin 平台，解析 HBM4、ICMS 存储分层以及 BlueField-4 DPU 如何突破万亿参数模型的内存壁垒，为开发者提供领先的技术洞察。
阅读全文 →
AI教程2026年1月27日
Karpathy 的 Claude Code 实践心得：AI 编程时代的深度反思与实战指南
深入分析 AI 大神 Andrej Karpathy 关于 Claude Code 的实战记录，探讨从手动编码到 Agent 驱动开发的“相变”过程，以及开发者在 2026 年面临的挑战与机遇。
阅读全文 →
模型评测2026年1月27日
开启开源大模型的代理强化学习训练：实践回顾
本文深入探讨了在开源大模型（GPT-OSS）中实现代理（Agentic）工作流强化学习（RL）的技术细节，涵盖 GRPO 算法、奖励模型设计及基础设施优化。
阅读全文 →
行业资讯2026年1月27日
Anthropic 发布 Claude 交互式应用，支持 Slack 及多种办公工具集成
Anthropic 通过推出交互式应用和深度办公工具集成，扩展了 Claude 的功能，允许用户直接在 Slack 等工具中执行复杂任务。
阅读全文 →
行业资讯2026年1月27日
微软发布自研 Maia AI 推理芯片 1000 亿晶体管助力性能飞跃
微软推出新一代自研 AI 推理芯片 Maia，集成超过 1000 亿个晶体管，在 4-bit 精度下可提供 10 Petaflops 的算力，旨在大幅降低大模型推理成本并提升响应速度。
阅读全文 →
AI教程2026年1月27日
vLLM 深度解析：PagedAttention 如何让大模型推理更快、更省钱
深入探讨 vLLM 如何通过 PagedAttention 技术解决 GPU 显存碎片化问题，并显著提升大语言模型（LLM）的推理吞吐量。
阅读全文 →
AI教程2026年1月27日
深度解析 Cursor 如何索引你的代码库：RAG 技术的实践
深入探讨 Cursor IDE 的 RAG 流水线，包括 Tree-sitter 解析、向量嵌入以及针对 AI 辅助编程优化的混合检索策略。
阅读全文 →