llama.cpp

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

AI教程2026年4月23日
Qwen 3.6 27B 发布：支持 GGUF 格式与本地多模态应用
阿里巴巴云发布了 Qwen 3.6 27B 模型，具备旗舰级编程能力，并由 Unsloth 同步推出了 GGUF 格式。结合 Rust 编写的多模态漫画翻译器，本地 LLM 部署正迎来性能与效率的双重突破。
阅读全文 →
AI教程2026年3月31日
在 NVIDIA Blackwell 与 Apple Silicon 上通过 10GbE 实现分布式 LLM 推理
本文深入探讨了如何利用 llama.cpp 和 10GbE 网络打破硬件壁垒，将 NVIDIA Blackwell 架构与 Apple M2 Ultra 结合，实现 200B+ 超大规模参数模型的分布式推理。
阅读全文 →
模型评测2026年2月21日
GGML 与 llama.cpp 加入 Hugging Face 推动本地 AI 长期发展
GGML 和 llama.cpp 正式加入 Hugging Face，这标志着本地 AI 生态进入了标准化的新阶段，将极大地加速开源模型在消费级硬件上的普及。本文深度解析这一变动对开发者和企业的深远影响。
阅读全文 →
AI教程2026年2月19日
为什么 Claude Code 会导致本地 LLM 推理崩溃
深入调查 Claude Code 在连接到 llama.cpp 等本地 LLM 服务器时崩溃的原因，并提供 Python 代理解决方案。
阅读全文 →
模型评测2026年1月6日
llama.cpp 模型管理：Hugging Face 集成、GGUF 增强与本地 LLM 工作流优化
深入探讨 llama.cpp 模型管理的最新更新，包括直接集成 Hugging Face、增强的 GGUF 支持，以及如何优化本地 LLM 工作流。同时对比 n1n.ai 等托管服务在生产环境中的优势。
阅读全文 →

获取奖励

llama.cpp

文章分类

热门标签

Qwen 3.6 27B 发布：支持 GGUF 格式与本地多模态应用

在 NVIDIA Blackwell 与 Apple Silicon 上通过 10GbE 实现分布式 LLM 推理

GGML 与 llama.cpp 加入 Hugging Face 推动本地 AI 长期发展

为什么 Claude Code 会导致本地 LLM 推理崩溃

llama.cpp 模型管理：Hugging Face 集成、GGUF 增强与本地 LLM 工作流优化