Ollama

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

AI教程2026年6月29日
在 OCI 容器实例上运行 Ollama：5 分钟构建私有 LLM API，无需 Kubernetes
了解如何在 Oracle Cloud Infrastructure (OCI) 上使用 Ollama 和容器实例部署私有且兼容 OpenAI 的 LLM 终点，无需复杂的 Kubernetes 运维。
阅读全文 →
AI教程2026年6月29日
构建全离线 RAG 智能体：使用 LangGraph Ollama 和嵌入式 Qdrant
本教程将教你如何使用 LangGraph、Ollama 和 Qdrant 嵌入式模式，在无需任何 API 密钥的情况下，在本地电脑上构建一个生产级的 RAG 智能体。
阅读全文 →
AI教程2026年6月27日
从本地 LLM 到工具调用智能体：使用 Gemma 2、Ollama 和 OpenAI Agents SDK 构建研究助手
本教程详细介绍了如何将 Google Gemma 2 等本地模型转化为具备联网搜索能力的自主智能体（Agent），涵盖 Ollama 配置、OpenAI SDK 集成以及 Tavily 搜索工具的应用。
阅读全文 →
AI教程2026年6月23日
构建基于 Gemma 4 和 OpenCode 的本地 AI 编程助手
本教程详细介绍了如何利用 Ollama、Gemma 4 和 OpenCode 框架，在本地环境中搭建一个安全、高效且完全私有的 AI 编程助手，实现零延迟、高隐私的代码开发。
阅读全文 →
AI教程2026年5月28日
本地 LLM 工作流优化：Ollama 量化机制、Light-Agent CLI 与 Qwen 3.7 Max 全解析
本文深入探讨本地 AI 领域的最新进展，包括 Ollama 的默认量化策略、专为本地编码设计的 Light-Agent v0.2.1，以及 Qwen 3.7 Max 在多模态生成方面的卓越表现。
阅读全文 →
AI教程2026年5月27日
Ollama v0.30.0、Qwen3.5 35B 与 WebGPU 上的 1-bit 多模态 AI
深入探讨本地 AI 的最新进展：Ollama 改进的互操作性、具备原生多轮对话保存能力的 Qwen3.5 35B 模型的发布，以及通过 WebGPU 在浏览器中运行的突破性 1-bit 文本生成图像模型。
阅读全文 →
AI教程2026年5月6日
部署 Gemma 4 MTP 与多模态 AI 本地化指南
深度解析 Google Gemma 4 的多 Token 预测技术、Microsoft VibeVoice 的 C++ 移植版以及 Ollama 离线桌面层，助力开发者构建高效本地 AI 生态。
阅读全文 →
AI教程2026年4月16日
本地推理大突破：1-bit Bonsai WebGPU、Ollama 多智能体与 Gemma4 26B 实战
探索本地大模型推理的最新革命：从通过 WebGPU 在浏览器运行 1-bit 模型，到使用 Ollama 和 Qwen3-Coder 构建复杂的多智能体系统。
阅读全文 →
AI教程2026年4月13日
本地运行大语言模型全攻略：Ollama 与 Gemma 4 实战指南
本指南将详细介绍如何利用 Ollama 和 Gemma 4 在本地构建生产级 AI 应用，彻底摆脱 API 费用和隐私困扰，同时保持高性能推理。
阅读全文 →
AI教程2026年4月10日
优化 Claude Code API 开销：多级模型路由架构指南
深入探讨如何通过实施分层模型路由架构来大幅降低 LLM API 的支出。将简单任务转移到本地模型，仅在复杂推理时使用顶级模型。
阅读全文 →
AI教程2026年4月6日
使用 Claude Code 免费运行 397B 参数 AI 模型教程
本教程将教你如何通过 Claude Code 和 Ollama Cloud，仅需三条命令即可在 Windows 上免费运行 Qwen 3.5 397B 超大规模模型，无需本地 GPU。
阅读全文 →
AI教程2026年3月31日
玩转本地大模型：Ollama 全方位实战指南
本教程详细介绍了如何安装 Ollama，在本地部署 Llama 3、DeepSeek-V3 等大模型，并将其集成到 Python 开发和 RAG 工作流中，实现零成本、高隐私的 AI 应用。
阅读全文 →