本地大模型

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

AI教程2026年7月9日
2026 年最佳本地编程模型：Qwen3-Coder 32B 对比 GLM-4.7
深入探讨 2026 年开发者本地 LLM 生态，对比 Qwen3-Coder 32B、GLM-4.7 及 DeepSeek 的实测表现，涵盖硬件需求、部署教程及行业分析。
阅读全文 →
AI教程2026年6月23日
构建基于 Gemma 4 和 OpenCode 的本地 AI 编程助手
本教程详细介绍了如何利用 Ollama、Gemma 4 和 OpenCode 框架，在本地环境中搭建一个安全、高效且完全私有的 AI 编程助手，实现零延迟、高隐私的代码开发。
阅读全文 →
AI教程2026年6月2日
Google Gemma 4 本地 AI 部署：显卡 GPU 选型与性能指南 (2026 版)
深入探讨 Google Gemma 4 系列模型的硬件需求、VRAM 显存管理以及革命性的 MoE 架构，为本地 LLM 部署提供专业的 GPU 选型建议。
阅读全文 →
模型评测2026年6月2日
Holo3.1 深度解析：构建快速且本地化的计算机操作智能体
本文深入探讨 Holo3.1 框架，这是一款专注于低延迟、隐私保护的本地计算机操作智能体（Computer Use Agent），涵盖技术架构、代码实现及性能对比。
阅读全文 →
AI教程2026年5月28日
构建实用的本地大模型智能体基础设施
深入探讨构建高性能本地 LLM 智能体所需的基础设施，涵盖 vLLM 推理引擎、DeepSeek-V3 模型选择、长文本处理以及混合云架构策略。
阅读全文 →
AI教程2026年5月28日
本地 LLM 工作流优化：Ollama 量化机制、Light-Agent CLI 与 Qwen 3.7 Max 全解析
本文深入探讨本地 AI 领域的最新进展，包括 Ollama 的默认量化策略、专为本地编码设计的 Light-Agent v0.2.1，以及 Qwen 3.7 Max 在多模态生成方面的卓越表现。
阅读全文 →
AI教程2026年5月27日
Ollama v0.30.0、Qwen3.5 35B 与 WebGPU 上的 1-bit 多模态 AI
深入探讨本地 AI 的最新进展：Ollama 改进的互操作性、具备原生多轮对话保存能力的 Qwen3.5 35B 模型的发布，以及通过 WebGPU 在浏览器中运行的突破性 1-bit 文本生成图像模型。
阅读全文 →
AI教程2026年5月26日
基于本地 Qwen 和 MCPS 构建零信任 AI 智能体指南
了解如何利用本地 Qwen 模型和 MCPS 协议构建零成本、零信任的 AI 智能体，实现加密级的工具调用完整性和绝对的数据隐私。
阅读全文 →
AI教程2026年5月3日
在 RTX 3090 上优化 Qwen3.6-27B 本地推理：原生 vLLM 与 Ollama 备选方案指南
深入探讨如何在消费级硬件上运行最先进的 Qwen3.6-27B 模型，利用原生 Windows vLLM 实现 72 tokens/s 的速度，并实施混合云端-本地策略。
阅读全文 →
AI教程2026年5月2日
PFlash 加速 llama.cpp 预填充与 Ollama 性能飞跃：Llama 3.2 安卓部署指南
深入了解 PFlash 如何实现 llama.cpp 预填充 10 倍提速，Ollama v0.22.1 对 Qwen 模型的性能优化，以及在安卓端部署微调 Llama 3.2 的实战教程。
阅读全文 →
AI教程2026年4月26日
打造具有持久记忆的本地 AI 助手：LM Studio 与 Big RAG 完整指南
本教程将指导你如何利用 Google 的 Gemma 4 模型和 LM Studio 部署一个完全离线的 AI 助手，并通过自定义 Big RAG 插件实现跨会话的持久记忆功能。
阅读全文 →
模型评测2026年4月17日
本地 LLM 的突破：Qwen3.6-35B-A3B 在视觉推理上超越 Claude Opus 4.7
深入分析本地模型（如 Qwen3.6-35B）如何在 SVG 生成等复杂空间推理任务中挑战 Claude 4.7 等云端巨头。
阅读全文 →