深度学习

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

AI教程2026年7月9日
基于目录工程的长文档层次化检索策略
深入探讨企业级文档智能中的循环工程，重点介绍如何通过目录 (TOC) 解析实现对 500 页以上长文档的高精度、低成本检索。
阅读全文 →
AI教程2026年7月4日
AI 智能体原理解析：ReAct 循环的工作机制与实现
深度探讨 ReAct（推理与行动）框架，解析 AI 智能体如何通过迭代循环解决复杂任务，并提供基于 Python 的实现指南。
阅读全文 →
AI教程2026年6月25日
深入理解 KV Cache：MQA、GQA 与 MLA 如何加速大模型推理
本文深入探讨了大语言模型推理中的核心优化技术 KV Cache，详细解析了 MQA、GQA 和 MLA 等注意力机制如何通过减少显存占用和计算冗余，显著提升模型推理速度与吞吐量。
阅读全文 →
模型评测2026年6月22日
PP-OCRv6 深度解析：支持 50 种语言的多尺度 OCR 模型（1.5M 至 34.5M 参数）
深入探讨百度 PaddleOCR 团队发布的 PP-OCRv6 模型，分析其在 Hugging Face 上的集成、多语言支持、以及从 1.5M 轻量级到 34.5M 高精度模型的架构演进与应用场景。
阅读全文 →
AI教程2026年6月13日
使用 Azure Layout 解析 PDF 表格以优化 RAG 系统
当 PyMuPDF 等标准库无法从复杂 PDF 中提取结构化数据时，Azure AI Document Intelligence 的 Layout 模型为 RAG 管道提供了强大的解决方案。
阅读全文 →
AI教程2026年6月9日
PagedAttention 对比传统 KV 缓存：vLLM 如何重塑 LLM 推理的 GPU 显存管理
深入探讨 vLLM 如何通过 PagedAttention 技术消除显存碎片，将大语言模型（LLM）的推理吞吐量提升高达 24 倍。
阅读全文 →
AI教程2026年6月6日
微调 Chronos-2 时间序列基础模型的五种方法
深入探讨微调 Chronos-2（基于 T5 架构的前沿时间序列基础模型）的五种核心策略，旨在提升特定领域预测任务的准确性与鲁棒性。
阅读全文 →
模型评测2026年5月29日
PyTorch 性能调优：torch.profiler 入门全指南
深入了解如何使用 PyTorch 原生工具 torch.profiler 进行性能分析。本文将教你如何识别计算瓶颈、可视化执行追踪，并优化深度学习模型以实现最高效率。
阅读全文 →
模型评测2026年5月19日
使用 LoRA 和 DoRA 微调 NVIDIA Cosmos Predict 2.5 实现机器人视频生成
深度解析如何利用 LoRA 和 DoRA 等参数高效微调（PEFT）技术，针对机器人领域优化 NVIDIA Cosmos Predict 2.5 模型。
阅读全文 →
AI教程2026年5月11日
Timer-XL：构建面向长上下文的时间序列预测基础模型
深入探讨 Timer-XL 的技术内幕，这是一款专为处理时间序列预测中极端上下文长度而设计的仅解码器（Decoder-only）Transformer 基础模型，以及它如何超越传统架构。
阅读全文 →
行业资讯2026年5月11日
CUDA 证明英伟达是一家软件公司
虽然全世界都在关注英伟达的 H100 和 Blackwell GPU，但其万亿美元霸权的真正秘密在于 CUDA。本文深入探讨了软件而非仅仅是硅片，如何为 AI 开发创造了不可逾越的护城河。
阅读全文 →
模型评测2026年5月9日
深入解析 EMO：通过预训练混合专家模型实现涌现模块化
本文深入探讨了 EMO 框架的技术细节，分析了混合专家模型（MoE）如何通过特定的预训练技术实现真正的模块化，以及这一突破对大语言模型（LLM）高效扩展的深远意义。
阅读全文 →