AI教程2026年5月28日本地 LLM 工作流优化:Ollama 量化机制、Light-Agent CLI 与 Qwen 3.7 Max 全解析本文深入探讨本地 AI 领域的最新进展,包括 Ollama 的默认量化策略、专为本地编码设计的 Light-Agent v0.2.1,以及 Qwen 3.7 Max 在多模态生成方面的卓越表现。阅读全文 →
AI教程2026年5月27日Ollama v0.30.0、Qwen3.5 35B 与 WebGPU 上的 1-bit 多模态 AI深入探讨本地 AI 的最新进展:Ollama 改进的互操作性、具备原生多轮对话保存能力的 Qwen3.5 35B 模型的发布,以及通过 WebGPU 在浏览器中运行的突破性 1-bit 文本生成图像模型。阅读全文 →
AI教程2026年5月6日部署 Gemma 4 MTP 与多模态 AI 本地化指南深度解析 Google Gemma 4 的多 Token 预测技术、Microsoft VibeVoice 的 C++ 移植版以及 Ollama 离线桌面层,助力开发者构建高效本地 AI 生态。阅读全文 →
AI教程2026年4月16日本地推理大突破:1-bit Bonsai WebGPU、Ollama 多智能体与 Gemma4 26B 实战探索本地大模型推理的最新革命:从通过 WebGPU 在浏览器运行 1-bit 模型,到使用 Ollama 和 Qwen3-Coder 构建复杂的多智能体系统。阅读全文 →
AI教程2026年4月13日本地运行大语言模型全攻略:Ollama 与 Gemma 4 实战指南本指南将详细介绍如何利用 Ollama 和 Gemma 4 在本地构建生产级 AI 应用,彻底摆脱 API 费用和隐私困扰,同时保持高性能推理。阅读全文 →
AI教程2026年4月10日优化 Claude Code API 开销:多级模型路由架构指南深入探讨如何通过实施分层模型路由架构来大幅降低 LLM API 的支出。将简单任务转移到本地模型,仅在复杂推理时使用顶级模型。阅读全文 →
AI教程2026年4月6日使用 Claude Code 免费运行 397B 参数 AI 模型教程本教程将教你如何通过 Claude Code 和 Ollama Cloud,仅需三条命令即可在 Windows 上免费运行 Qwen 3.5 397B 超大规模模型,无需本地 GPU。阅读全文 →
AI教程2026年3月31日玩转本地大模型:Ollama 全方位实战指南本教程详细介绍了如何安装 Ollama,在本地部署 Llama 3、DeepSeek-V3 等大模型,并将其集成到 Python 开发和 RAG 工作流中,实现零成本、高隐私的 AI 应用。阅读全文 →
AI教程2026年3月28日Ollama 免费 API:一行命令实现大语言模型本地部署与开发深入了解如何使用 Ollama 在本地部署和运行大语言模型。学习利用其兼容 OpenAI 的 API 进行私密、低成本且高性能的 AI 应用开发。阅读全文 →
AI教程2026年3月23日使用本地 LLM 运行 Karpathy 的 autoresearch 实现零成本自主 AI 研究本教程将教你如何通过本地运行的 Qwen 3.5 9B 和 Ollama 复现 Andrej Karpathy 的自主 AI 研究实验,在无需支付 API 费用的情况下实现自动化的模型优化循环。阅读全文 →
AI教程2026年3月14日通过 MCP 协议为本地大语言模型赋予浏览器自动化超级能力了解如何将 Ollama 和 LM Studio 等本地大模型与 PageBolt MCP 集成,在不牺牲隐私的情况下执行复杂的浏览器自动化任务、截图和网页抓取。阅读全文 →