模型评测2026年3月11日NVIDIA 如何构建 AI 开源数据生态深入探讨 NVIDIA 如何通过合成数据生成 (SDG)、HelpSteer2 数据集以及 Nemotron-4 340B 模型流水线,打破 AI 训练的数据瓶颈,构建开放的 AI 生态系统。阅读全文 →
行业资讯2026年1月26日ChatGPT 引用 Elon Musk 的 Grokipedia 数据:LLM 训练与数据来源的影响分析最近的报告显示,ChatGPT 的回答中开始出现来自 Elon Musk 旗下 xAI 开发的 Grokipedia 内容。这一现象引发了关于合成数据循环、模型塌缩以及 LLM 数据溯源未来的深度讨论。阅读全文 →
模型评测2026年1月5日利用 Claude 3.5 Sonnet 合成数据微调 Llama 3 等开源大模型本文详细介绍了如何利用 Claude 3.5 Sonnet 作为“老师”模型,通过合成数据生成技术对 Llama 3 等开源大模型进行微调。涵盖代码实现、数据策略及 n1n.ai 平台的应用。阅读全文 →