视觉语言模型

浏览我们所有的行业资讯、模型评测与 AI 教程。

模型评测2026年6月4日
ScreenAI：一种用于 UI 和视觉语言理解的视觉语言模型
深入评测 Google 推出的 ScreenAI 模型，这是一个拥有 50 亿参数的视觉语言模型，通过灵活的分块策略和 LLM 驱动的数据生成技术，在 UI 界面和信息图表理解方面达到了业界领先水平。
阅读全文 →
模型评测2026年6月2日
Holo3.1 深度解析：构建快速且本地化的计算机操作智能体
本文深入探讨 Holo3.1 框架，这是一款专注于低延迟、隐私保护的本地计算机操作智能体（Computer Use Agent），涵盖技术架构、代码实现及性能对比。
阅读全文 →
模型评测2026年2月24日
在 NVIDIA Jetson 上部署开源视觉语言模型 (VLM) 的优化指南
本指南详细介绍了如何在 NVIDIA Jetson Orin 平台上部署和优化 PaliGemma、Moondream 等开源视觉语言模型，涵盖 TensorRT-LLM 加速、4-bit 量化以及边缘端推理实战。
阅读全文 →

获取奖励

ScreenAI：一种用于 UI 和视觉语言理解的视觉语言模型