模型评测2026年6月4日ScreenAI:一种用于 UI 和视觉语言理解的视觉语言模型深入评测 Google 推出的 ScreenAI 模型,这是一个拥有 50 亿参数的视觉语言模型,通过灵活的分块策略和 LLM 驱动的数据生成技术,在 UI 界面和信息图表理解方面达到了业界领先水平。阅读全文 →
模型评测2026年6月2日Holo3.1 深度解析:构建快速且本地化的计算机操作智能体本文深入探讨 Holo3.1 框架,这是一款专注于低延迟、隐私保护的本地计算机操作智能体(Computer Use Agent),涵盖技术架构、代码实现及性能对比。阅读全文 →
模型评测2026年2月24日在 NVIDIA Jetson 上部署开源视觉语言模型 (VLM) 的优化指南本指南详细介绍了如何在 NVIDIA Jetson Orin 平台上部署和优化 PaliGemma、Moondream 等开源视觉语言模型,涵盖 TensorRT-LLM 加速、4-bit 量化以及边缘端推理实战。阅读全文 →