通义千问Qwen2.5开源了吗？性能如何？

1个回答

liuyubao

2026-01-16 05:05

阿里云

通义首次开源引发全球开发者热议。一年内，阿里云大模型实现重要升级，持续引领技术创新与发展潮流。9月19日云栖大会上，CTO周靖人宣布通义千问推出新一代开源模型Qwen2.5，其中Qwen2.5-72B超越Llama 3.1-405B，重夺全球开源大模型性能冠军。同时，通义核心模型Qwen-Max全面升级，性能接近GPT-4o水平，展现强大技术实力与创新能力。

通义千问以持续优化的技术和多样化的应用场景，快速成为开发者青睐的对象，尤其在中文用户中备受瞩目。此次升级，模型在代码、数学与语言处理方面更进一步，同时具备卓越的多模态与视觉理解能力，堪称当前人工智能领域的领先代表。百宝箱：通义千问2.5Qwen2.5系列堪称超级AI模型的百宝箱，包含多种尺寸的大语言模型、多模态模型、数学模型及代码模型。各尺寸均提供基础版、指令优化版和量化版，总计推出100多个模型，创下行业新纪录。

集合链接：https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e （请注意，该链接指向外部网站内容，访问时需确保符合相关网络规定。）在语言模型领域，Qwen2.5 开源了七个不同规模的版本，参数量分别为 0.5B、1.5B、3B、7B、14B、32B 和 72B，每个版本都在同参数量级中达到了行业领先水平。这些模型的设计充分考虑了下游应用场景的多样化需求。其中，3B 版本是针对手机等终端设备优化的理想选择，而 32B 则因出色的性能与能耗比，成为开发者心目中的性价比之王。值得一提的是，Qwen2.5-32B 的综合表现尤为亮眼，甚至超越了 Qwen2-72B，展现出强大的实力。Qwen2.5 系列模型基于 18 万亿（18T）tokens 的海量数据进行预训练，相较于 Qwen2，其整体性能提升了超过 18%，具备更广泛的知识储备以及显著增强的编程与数学能力。其中，旗舰版 Qwen2.5-72B 在多项权威基准测试中表现出色：在 MMLU-redux（通用知识）、MBPP（代码能力）和 MATH（数学能力）测试中分别获得了 86.8、88.2 和 83.1 的高分。该系列的核心产品 72B 模型，凭借高效的参数设计，在多个关键任务上实现了突破，仅用不到 1/5 的参数量便超越了拥有 4050 亿参数的 Llama3.1-405B 模型，展现了强大的性能优势与技术领先性。

在专用模型领域，Qwen2.5-Coder 和 Qwen2.5-Math 实现了显著突破。其中，Qwen2.5-Coder 基于 5.5 万亿（5.5T）个编程相关数据 token 进行训练，目前已开源 1.5B 和 7B 版本，后续还将推出 32B 版本的开源计划。而 Qwen2.5-Math 则通过思维链与工具集成推理（TIR）技术，能够高效解决中英文数学问题，成为当前最先进的开源数学模型系列。此次共开源了三个不同规模的版本，包括 1.5B、7B 和 72B，同时发布了一款专门用于数学任务评估的奖励模型 Qwen2.5-Math-RM。这些成果不仅展现了模型在特定领域的深度优化能力，也为开发者和研究人员提供了更多可能性。

在多模态技术领域，视觉语言模型 Qwen2-VL-72B 已正式开源。该模型拥有卓越的视觉理解能力，可识别多种分辨率与长宽比的图像，并支持解析时长达 20 分钟以上的视频内容。此外，Qwen2-VL 还能实现手机及机器人视觉智能操作，展现出广泛而灵活的实际应用潜力。

Qwen2-VL-72B 在 LMSYS 聊天机器人竞技场排行榜中，成为全球评分最高的开源视觉理解模型。这标志着其在多模态处理能力上达到了领先水平。Qwen-Max迎来全方位性能提升目前，通义官网与通义APP均采用Qwen-Max模型，持续为用户提供免费服务。同时，您能借助阿里云百炼平台调用Qwen-Max的API，亲身感受其卓越性能。

那么，Qwen-Max究竟有多强大？相较于上一代模型，该模型在训练过程中采用了更庞大的训练数据量、更大的模型规模，并且进一步强化了与人类价值观的对齐，从而实现了智能水平的重大突破。在包括 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准测试中，Qwen-Max 的表现已逼近 GPT-4o。特别是在数学能力和编程能力方面，其成绩甚至超越了 GPT-4o。要知道，数学与代码所体现的推理能力，正是衡量大模型智能水平的核心关键所在。

更令人振奋的是，相较于2023年4月发布的初代通义千问大模型，Qwen-Max的理解能力提升了46%，数学能力提高了75%，代码能力更是翻了一番达到102%。同时，其抗幻觉能力上升了35%，指令遵循能力大幅增长105%。还有一个重磅提升，模型与人类偏好的对齐程度实现了质的飞跃，提升了超过700%。这表明Qwen-Max不仅变得更加智能，还更能契合用户的期望与需求。

举报有用（0）分享收藏

通义千问Qwen2.5开源了吗？性能如何？

1个回答

liuyubao

热门话题

相关问题