AI教程2026年5月24日NVIDIA Nemotron-Labs Diffusion:实现 LLM 推理速度 6 倍提升NVIDIA 推出的 Nemotron-Labs Diffusion 模型系列通过单一检查点实现了三种生成模式:自回归、扩散和自我推测。无需更改现有代码,即可获得高达 6.4 倍的吞吐量提升。阅读全文 →