使用 Ollama 构建本地 RAG 航空评论 AI 智能体教程

随着大语言模型 (LLM) 技术的普及，越来越多的开发者开始关注数据隐私和运行成本。在本地环境构建 AI 应用不仅能显著降低 API 开销，还能确保敏感数据（如企业内部评论或用户反馈）不外泄。本文将带你一步步实现一个基于本地 RAG（检索增强生成）架构的航空评论 AI 智能体。我们将使用 Ollama 作为模型运行运行时，结合 LangChain 框架，打造一个完全离线的智能化分析工具。同时，我们也会探讨在本地资源不足时，如何通过 n1n.ai 提供的稳定 API 接口实现能力的平滑扩展。

为什么选择本地 RAG 架构？

检索增强生成 (Retrieval-Augmented Generation, RAG) 是目前解决 LLM 幻觉问题最有效的方案之一。通过将外部知识库（如 CSV、PDF 或数据库）向量化并存储在向量数据库中，模型可以在回答问题前先检索相关信息。选择本地化部署有以下核心优势：

隐私保护：所有数据处理都在本地完成，无需上传至云端。
零成本尝试：使用 Ollama 运行开源模型（如 Llama 3.2）不需要支付每 Token 的调用费用。
极低延迟：在高性能本地机器上，响应速度往往优于跨国网络请求。

当然，当你需要更强大的推理能力（如使用 DeepSeek-V3 或 Claude 3.5 Sonnet）时，n1n.ai 提供的 API 聚合服务将是你的最佳备选方案。

技术栈核心组件

本项目的核心工具链如下：

Ollama: 本地模型管理引擎，支持多种主流开源模型。
Llama 3.2: Meta 发布的轻量级且强大的大模型，非常适合在个人电脑上运行。
mxbai-embed-large: 专门用于文本向量化的模型，能精准捕捉语义信息。
ChromaDB: 简单易用的向量数据库，用于存储和检索评论数据。
LangChain: 链接数据流、检索器和生成器的核心框架。

第一步：准备数据集

我们从 Kaggle 获取了一份航空公司评论数据集。为了提高检索效率，我们需要对原始 CSV 进行预处理。原始数据可能包含大量无关列，我们仅保留 airline_name（航空公司名称）、content（评论内容）和 overall_rating（评分）。

通过使用 Pandas，我们可以快速清洗数据：

import pandas as pd

# 读取数据并筛选核心列
df = pd.read_csv('airline_reviews.csv')
df = df[['airline_name', 'content', 'overall_rating']].dropna()
# 导出精简版以加速处理
df.to_csv('filtered_reviews.csv', index=False)

第二步：安装与配置 Ollama

在开始编写 Python 代码之前，请确保你的系统中已安装 Ollama。你可以通过以下命令拉取我们需要的模型：

ollama pull llama3.2
ollama pull mxbai-embed-large

mxbai-embed-large 是目前社区公认的优秀嵌入模型，能够将长文本转化为高维向量，其检索精度在本地模型中名列前茅。对于追求极致稳定性的开发者，n1n.ai 也提供了同级别的云端嵌入接口，确保在任何环境下都能获得一致的搜索效果。

第三步：核心代码实现

我们将实现分为三个模块：加载数据、向量化存储、以及问答链构建。

1. 向量化存储 (Vector Ingestion)

利用 langchain-chroma 和 langchain-ollama，我们可以轻松完成文档的向量化：

from langchain_ollama import OllamaEmbeddings
from langchain_chroma import Chroma
from langchain_community.document_loaders import CSVLoader

# 加载精简后的 CSV
loader = CSVLoader(file_path="filtered_reviews.csv", text_column="content")
docs = loader.load()

# 初始化嵌入模型
embeddings = OllamaEmbeddings(model="mxbai-embed-large")

# 创建向量库并持久化
vector_db = Chroma.from_documents(
    documents=docs,
    embedding=embeddings,
    persist_directory="./airline_db"
)

2. 构建 RAG 链 (RAG Chain)

我们需要定义一个提示词模板 (Prompt Template)，强制要求模型仅根据检索到的内容回答问题，以防止其产生“幻觉”。

from langchain_ollama import ChatOllama
from langchain.prompts import ChatPromptTemplate

llm = ChatOllama(model="llama3.2", temperature=0)

template = """
你是一个专业的航空公司评论分析专家。
请根据以下提供的评论内容回答问题。

相关评论：\{context\}

待回答问题：\{input\}

注意：仅根据上述评论回答。如果评论中没有相关信息，请回答“未找到相关评论”。
"""

prompt = ChatPromptTemplate.from_template(template)

第四步：测试与验证

我们可以针对不同的场景进行测试：

场景 A（有效查询）：询问“乘客对阿联酋航空 (Emirates) 的评价如何？”系统会检索出所有关于阿联酋航空的评论，并总结其服务质量、餐饮和准点率。
场景 B（无效查询）：询问“本田 CR-V 这款车怎么样？”由于我们的数据库中只有航空公司评论，检索器将无法找到相关文档，模型会根据指令回答“未找到相关评论”。

这种机制确保了 AI 智能体在特定领域内的专业性和准确性。在复杂的企业级应用中，如果本地算力无法满足并发需求，可以通过 n1n.ai 快速切换到高性能的云端 API，实现无缝扩容。

总结与展望

通过 Ollama 和 LangChain，我们成功构建了一个轻量级、高性能且完全本地化的 RAG 智能体。这证明了在 2025 年，个人开发者完全有能力在不依赖昂贵云服务的情况下，开发出具有实际价值的 AI 工具。当然，本地化只是第一步，随着业务规模的扩大，结合 n1n.ai 的高可用 API 架构将是实现 AI 规模化落地的关键路径。

立即在 n1n.ai 获取免费 API 密钥。

参考来源：https://dev.to/najilouis/building-a-local-rag-ai-agent-for-airline-reviews-with-ollama-2ik5