VL轻量化版本发布：4B/8B参数模型性能超越Gemini与GPT

文章正文

发布时间：2025-11-11 13:00

阿里通义千问Qwen3-VL轻量化版本发布：4B/8B参数模型性能超越Gemini与GPT-5同级产品

10月15日，阿里巴巴通义千问团队正式对外发布了其视觉语言模型系列Qwen3-VL的4B和8B两个新版本。这两个不同参数规模的模型均提供Instruct与Thinking两种变体，在数十项国际权威基准测试中，性能表现全面超越了包括Gemini 2.5 Flash Lite、GPT-5 Nano在内的同级别顶尖模型。

阿里巴巴通义千问（Qwen）在X平台发布推文，介绍Qwen3-VL的4B和8B版本模型，支持Instruct与Thinking变体，强调降低VRAM占用、保留核心能力且多维度性能超越竞品模型。

如上图所示，通义千问团队通过官方社交平台宣布了Qwen3-VL轻量化版本的核心特性。这一技术突破充分体现了阿里在大模型压缩与优化领域的深厚积累，为开发者提供了兼具高性能与低门槛的多模态AI解决方案。

此次发布的Qwen3-VL 4B/8B版本主要实现了三大关键突破：首先是显著降低了部署门槛，通过模型尺寸的优化大幅减少了显存占用，使开发者能够在更广泛的硬件环境中部署运行；其次是核心功能的完整保留，在轻量化的同时确保了与大尺寸模型同等的功能覆盖；最后是卓越的综合性能，在STEM领域问答、视觉理解、光学字符识别、视频内容解析及智能体任务等多个维度均达到行业领先水平。

在具体性能表现上，Qwen3-VL 8B Instruct版本在MIABench、OCRBench等30项权威测评中均取得SOTA（行业最佳）成绩，不仅超越了Gemini 2.5 Flash Lite和GPT-5 Nano等竞品，部分场景下性能甚至可与阿里半年前发布的Qwen2.5-VL-72B旗舰模型相媲美。4B Instruct版本同样展现出"以小博大"的实力，在参数量更少的情况下实现了与同类模型的性能对打。Thinking版本则在推理能力上更进一步，8B和4B型号分别在MathVision、MMStar等23项基准测试中超越了包括Gemini 2.5 Flash Lite高版本在内的诸多顶尖开源模型，同时在纯文本处理能力上也较前代产品有全面提升。

图片为阿里通义千问Qwen3-VL 4B Instruct和8B Instruct模型与其他模型在STEM、VQA、OCR、视频理解等多类基准测试中的性能对比表格，展示其多模态性能优势。

如上图所示，表格清晰呈现了Qwen3-VL轻量化版本与同类模型的性能对比数据。这些实测结果有力证明了阿里在模型架构设计与训练优化方面的技术优势，为开发者选择合适的AI模型提供了客观参考依据。

模型发布后迅速引发全球开发者社区的广泛关注，海外技术论坛中众多开发者表示"终于等到适合16GB内存Mac设备的高性能视觉模型"，并纷纷表达了对Qwen3-Max等后续版本的期待。这一热烈反响印证了轻量化高性能模型的市场需求，也反映出Qwen3-VL系列已建立起强大的品牌影响力。

值得注意的是，Qwen3-VL系列此前已在9月底的Chatbot Arena视觉子榜单中位列全球第二、开源第一，同时在纯文本赛道斩获开源领域全球第八的佳绩，成为首个在文本与视觉两大领域同时保持开源领先的大模型。在OpenRouter平台的图像处理API市场份额排名中，Qwen3-VL更是以48%的占比跃居全球第一。为帮助用户快速上手，阿里还同步推出了涵盖图像思维、计算机使用Agent、多模态编程等丰富场景的Qwen3-VL Cookbook使用指南。

随着轻量化版本的推出，Qwen3-VL系列进一步完善了其产品矩阵，有望在智能终端、边缘计算、行业解决方案等更多场景实现规模化应用。阿里通义千问团队通过持续的技术创新，正在不断推动多模态AI从实验室走向实际生产环境，为人工智能的普及应用贡献重要力量。

标签