AI教程2026年6月23日在 Modal 上部署 GLM-5.2-FP8 (700B MoE):8x H200 无服务器架构、权衡与实战经验深入探讨如何使用 8x NVIDIA H200 GPU 集群部署智谱 AI 最新的 700B 参数 MoE 模型,涵盖 FP8 量化、vLLM 优化及无服务器冷启动调优。阅读全文 →