本地部署

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

AI教程2026年5月24日
在 50 美元的显卡上运行 Flux Schnell 和 LLM 教程：无需 CUDA 和 ROCm
本教程详细介绍了如何利用 Vulkan 后端在老旧的 AMD RX 580 显卡上实现 FLUX.1 Schnell 和大语言模型的本地推理，突破 ROCm 不再支持旧架构的限制。
阅读全文 →
AI教程2026年5月6日
部署 Gemma 4 MTP 与多模态 AI 本地化指南
深度解析 Google Gemma 4 的多 Token 预测技术、Microsoft VibeVoice 的 C++ 移植版以及 Ollama 离线桌面层，助力开发者构建高效本地 AI 生态。
阅读全文 →
AI教程2026年4月24日
为什么本地大模型 JSON 输出会崩溃：常见错误模式与修复代码指南
本地大模型（如 Llama 3 或 Qwen）在生成结构化 JSON 时经常出现解析错误或类型不匹配。本文深入分析了三种主要的失败模式，并提供了使用 GBNF 语法、JSON Schema 引导和两阶段生成技术的实战解决方案。
阅读全文 →
AI教程2026年4月23日
Qwen 3.6 27B 发布：支持 GGUF 格式与本地多模态应用
阿里巴巴云发布了 Qwen 3.6 27B 模型，具备旗舰级编程能力，并由 Unsloth 同步推出了 GGUF 格式。结合 Rust 编写的多模态漫画翻译器，本地 LLM 部署正迎来性能与效率的双重突破。
阅读全文 →
AI教程2026年4月22日
使用本地 SLM 替代 GPT-4 提升 CI/CD 流水线的稳定性
深入探讨为什么将 CI/CD 自动化任务从 GPT-4 等大型模型迁移到本地小语言模型 (SLM) 可以解决非确定性问题、降低延迟并显著提升 DevOps 流程的可靠性。
阅读全文 →
AI教程2026年4月13日
Google Gemma 4 全方位技术指南：从 PLE 架构创新到 Ollama 本地部署
深入解析 Google DeepMind 发布的 Gemma 4 开源模型系列。涵盖 PLE 架构原理、Apache 2.0 协议影响、与 Llama 4 的性能对比，以及如何使用 Ollama 和 vLLM 进行本地高效部署。
阅读全文 →
AI教程2026年4月6日
谷歌 Gemma 4 模型本地运行深度测评：26B MoE 与 31B Dense 实测对比
本文详细测试了谷歌最新发布的 Gemma 4 系列模型在本地硬件上的表现。通过对比 26B 混合专家模型 (MoE) 与 31B 稠密模型 (Dense) 在 RTX 4090 和高性能 CPU 上的运行数据，为开发者提供详尽的部署建议。
阅读全文 →
AI教程2026年3月18日
部署你的第一个本地大语言模型
一份关于本地部署大语言模型（LLM）的全面指南，涵盖硬件选择、量化技术以及使用 Ollama 和 vLLM 的分步实施方案。
阅读全文 →
AI教程2026年3月15日
LocalAI 快速入门：在本地运行兼容 OpenAI 接口的大语言模型
本教程详细介绍了如何部署和配置 LocalAI。LocalAI 是一个自托管、开源的 OpenAI 兼容 API 服务器，支持在本地硬件上运行大语言模型、图像生成和语音处理任务。
阅读全文 →
AI教程2026年2月14日
2026 年本地 LLM 深度评测：开源 AI 模型性能全解析
本文深度对比了 2026 年领先的开源大模型（如 Kimi K2.5、DeepSeek V3.2 和 GLM-4.7），涵盖代码生成、逻辑推理及 Agent 协作等核心维度的技术指标与硬件要求。
阅读全文 →
AI教程2026年2月13日
2026 年本地大模型硬件配置指南
深度分析 125 个本地 LLM 模型（包括 Qwen 3、DeepSeek R1、GLM-5），涵盖从 8GB 内存到工作站级别的全硬件段位选择建议。
阅读全文 →
AI教程2026年2月11日
使用 Ollama、Open WebUI 和 Chroma DB 构建生产级 RAG 服务器指南
本教程详细介绍了如何利用 Ollama 推理引擎、Chroma DB 向量数据库和 Open WebUI 界面，构建一个私有化、生产就绪的检索增强生成 (RAG) 系统。
阅读全文 →