大语言模型

浏览我们所有的行业资讯、模型评测与 AI 教程。

所有文章

文章分类

热门标签

查看所有标签→

行业资讯2026年7月9日
OpenAI 发布全新语音模型实现更自然的实时对话
OpenAI 推出的最新实时语音 API 支持全双工通信，显著降低了延迟，为实时翻译、虚拟助手和企业级客服提供了更自然的交互体验。
阅读全文 →
行业资讯2026年7月7日
首个 AI 运行的勒索软件攻击仍需人类干预
尽管有报道称发生了首个完全自主的 AI 勒索软件攻击，但深度分析显示，这实际上是一个“人机协作”的过程，AI 负责技术执行，而人类则负责战略决策和基础设施建设。
阅读全文 →
AI教程2026年7月6日
Cohere Aya 23 深度解析：多语言开源模型的新标杆
深入探讨 Cohere 发布的 Aya 23 系列模型。本文将分析其 8B 与 35B 参数版本的技术架构、多语言性能优势以及在企业级 RAG 场景中的实际应用，为开发者提供详尽的部署指南。
阅读全文 →
AI教程2026年7月5日
如何在单张 GPU 上花三美元微调 7B 模型
打破显存迷思，利用 QLoRA 和 Unsloth 技术，仅需一杯咖啡的成本即可在消费级显卡上完成 Llama 3.1 等大模型的专业级微调。
阅读全文 →
行业资讯2026年6月28日
OpenAI 遵循特朗普政府要求推迟 GPT-5.6 发布
据报道，OpenAI 已同意特朗普政府的要求，交错发布其下一代大模型 GPT-5.6，并仅向通过政府审核的企业客户提供受限预览版。
阅读全文 →
AI教程2026年6月21日
如何在 16GB 显存上使用 QLoRA 微调 Qwen2.5-7B 模型
本文详细介绍了如何利用 QLoRA 技术将 7B 参数模型的显存占用从 15GB 压缩至 5.4GB，从而在 NVIDIA T4 等 16GB 显存的消费级 GPU 上实现高效微调。
阅读全文 →
AI教程2026年6月14日
为什么超长上下文无法修复 RAG 及其优化方案
深入探讨超长上下文在 RAG 系统中的局限性，特别是在处理聚合计算任务时的失效原因，并提供一种结合确定性引擎的混合架构解决方案。
阅读全文 →
行业资讯2026年6月1日
第三方 AI 模型评估指南：构建可信的人工智能评估框架
OpenAI 发布了针对第三方 AI 评估的新框架指南，重点关注模型能力、安全保障和科学有效性。本文将深入探讨该评估手册的技术方法论及开发者的实施策略。
阅读全文 →
行业资讯2026年5月12日
谷歌拦截首个由人工智能开发的零日漏洞攻击
谷歌威胁情报小组（GTIG）识别并阻止了首例确认由 AI 协助开发的零日漏洞攻击。该漏洞针对开源系统管理工具，旨在绕过双因素身份验证（2FA），标志着网络安全威胁进入了 AI 自动化时代。
阅读全文 →
AI教程2026年4月30日
DeepSeek V4 Pro 技术解析与 AI 代理应用指南
深入探讨 DeepSeek V4 Pro 的核心特性，包括 1.6T MoE 架构、100 万 Token 上下文窗口以及针对 AI 代理优化的双思维模式，助力开发者构建高效、低成本的自动化工作流。
阅读全文 →
行业资讯2026年4月29日
通用汽车将为 400 万辆汽车集成 Google Gemini AI
通用汽车宣布将 Google Gemini AI 引入 400 万辆凯迪拉克、雪佛兰、别克和 GMC 汽车。此次通过 OTA 更新实现的升级，标志着大语言模型在汽车行业的大规模落地。
阅读全文 →
AI教程2026年4月28日
DeepSeek V4 Pro 正式发布：AI Agent 开发的全新里程碑
深入分析 DeepSeek V4 Pro 的核心技术更新，包括 1.6T MoE 架构、双模式推理机制以及 100 万 Token 的超长上下文支持，探讨其在 AI Agent 领域的实战优势。
阅读全文 →