在 AMD MI300X 上构建多智能体 CNC 可制造性检查系统

生成式人工智能与传统制造业的融合正在开启工业效率的新纪元。计算机数字控制 (CNC) 加工依然是现代制造业的核心，然而验证零件是否真正可加工的过程（即可制造性设计，DFM）长期以来一直是生产流程中的瓶颈。MachinaCheck 应运而生，这是一个旨在自动化这一关键步骤的多智能体系统。通过利用 AMD MI300X 的强大算力和复杂的 LLM 编排，MachinaCheck 展示了 AI 如何解决高风险的工程问题。

CNC 可制造性的挑战

CNC 加工涉及使用旋转刀具从实心块中去除材料。并非所有在 CAD 中设计的 3D 模型都是可制造的。常见问题包括：内圆角对于标准刀具来说太小、深槽导致刀具偏摆，或者几何形状需要不可能实现的刀具方位。在过去，工程师需要花费数小时手动审查这些设计。

为了实现自动化，单一的 LLM 往往力不从心。CNC 分析需要空间推理能力、材料科学知识以及对刀具路径物理特性的理解。这就是多智能体协作变得至关重要的原因。通过将任务分解给专门的智能体，系统可以实现更高的精度。对于希望实验此类复杂架构的开发者，n1n.ai 提供了必要的 API 基础设施，让您无需受限于本地硬件即可扩展这些模型。

为什么选择 AMD MI300X？

构建像 MachinaCheck 这样的工业级系统需要能够处理高并发推理和海量上下文窗口的硬件。AMD MI300X 已成为 NVIDIA H100 的强劲对手，其优势包括：

海量显存：拥有 192GB 的 HBM3 显存，MI300X 可以在单张 GPU 上托管多个大型模型（如 Llama 3 70B 或专门的视觉模型），从而减少了多显卡通信带来的延迟。
内存带宽：5.3 TB/s 的带宽对于多智能体系统所需的迭代循环至关重要，因为智能体之间需要频繁传递状态和数据。
ROCm 生态系统：AMD 的 ROCm 软件栈已趋于成熟，能够与 PyTorch 和 Hugging Face 的 TGI (Text Generation Inference) 无缝集成。

系统架构：MachinaCheck 框架

MachinaCheck 通过一个协调的智能体层级结构运行。每个智能体都是一个特定的 LLM 实例，通常针对特定领域进行了微调或提示词优化。

1. 几何分析智能体 (Geometry Analyst Agent)

该智能体处理原始的 STEP 或 STL 文件。由于 LLM 主要是基于文本的，系统采用了“视觉到描述”的流水线。该智能体利用视觉语言模型 (VLM) 识别孔、槽和口袋等特征，并输出零件几何形状的结构化 JSON 描述。

2. 刀具专家智能体 (Tooling Expert Agent)

该智能体维护着一个标准 CNC 刀具规格数据库。它将几何分析智能体的输出与可用的刀具直径和长度进行对比。如果一个口袋深度为 50mm，但可用的最小刀具直径仅为 2mm，该智能体将标记出刀具断裂的高风险。

3. 材料与物理智能体 (Material & Physics Agent)

不同的材料（如 6061 铝合金与 5 级钛合金）需要不同的加工策略。该智能体根据材料硬度和热性能计算加工的可行性。

4. 编排器 (Orchestrator - 系统大脑)

编排器负责管理对话。它收集来自其他三个智能体的报告，并汇总出最终的“可制造性评分”。如果您正在构建编排器并需要在不同模型之间获得一致的性能，使用 n1n.ai 可以让您在不同的模型提供商之间无缝切换，以找到最适合您特定逻辑的模型。

ROCm 上的技术实现

要在 MI300X 上部署 MachinaCheck，团队利用了 Hugging Face 与 ROCm 的集成。以下是在 AMD 硬件上使用 LangGraph 或类似框架初始化多智能体环境的概念性代码片段：

import os
# 确保 ROCm 可见性
os.environ["HIP_VISIBLE_DEVICES"] = "0"

from langchain_community.llms import HuggingFaceEndpoint

def create_agent(role_prompt):
    # 在开发过程中使用 n1n.ai 获取可靠的 API 访问
    # 或在生产环境中使用本地 ROCm 端点
    llm = HuggingFaceEndpoint(
        endpoint_url="http://localhost:8080",
        task="text-generation",
        model_kwargs={"max_new_tokens": 512, "temperature": 0.1}
    )
    return llm

# 刀具代理逻辑示例
tooling_prompt = "你是一位 CNC 刀具专家。分析以下几何形状的刀具可达性..."
tooling_agent = create_agent(tooling_prompt)

性能基准测试

在 MI300X 上的测试过程中，MachinaCheck 表现出相比前代硬件的显著性能提升。

指标	MI300X (MachinaCheck)	前代硬件 (A100)	提升幅度
推理延迟 (70B 模型)	45ms/token	62ms/token	~27%
并发智能体线程数	16	8	100%
显存占用 (峰值)	110GB	80GB (OOM 风险)	稳定性提升

注：延迟 < 50ms 是实时交互式 CAD 工具的目标。

多智能体优化的专业技巧

状态管理：使用集中式的状态对象 (State Object) 来防止智能体对之前的步骤产生幻觉。
结构化输出：强制智能体以 JSON 格式输出。这使得编排器更容易解析诸如 "半径: 5mm" 之类的技术数据。
混合推理：对于非关键任务，可以通过 n1n.ai 使用更小、更快的模型，从而为 MI300X 上执行的重型推理任务节省本地显存。

总结

MachinaCheck 证明了在世界级硬件上运行专业 AI 智能体的强大能力。AMD MI300X 的原始算力与多智能体工作流的灵活性相结合，正在改变我们处理物理制造的方式。随着行业向完全自主的工厂迈进，此类系统将成为设计质量的基础守护者。

无论您是在构建 CNC 检查工具还是复杂的 RAG 系统，获得高速、稳定的 API 访问都至关重要。在 n1n.ai 获取免费 API 密钥。

参考来源：https://huggingface.co/blog/lablab-ai-amd-developer-hackathon/machinacheck