阿里开源“核弹级”代码模型!Qwen3-Coder 480B MoE 今天上线,性能直接对标 Claude Sonnet4

AI ToolBox
AI ToolBox
2025年7月23日

智能编程迈入新阶段:Qwen3-Coder全面开源

7月23日,阿里云 宣布其最新AI编程大模型------Qwen3-Coder正式全面开源,此举迅速在智能编程领域引发广泛关注。凭借卓越的代码生成与Agent能力,Qwen3-Coder在Agentic Coding、Agentic Browser-Use及基础编码任务中均达到开源模型的领先水平,标志着编程智能化迈向了全新高度。

图片

强大架构支持,满足复杂编程需求

Qwen3-Coder模型系列提供了多种参数量级选择,此次率先开源的是其性能最强的版本:Qwen3-Coder-480B-A35B-Instruct。该版本采用先进的MoE架构,参数总量高达4800亿,激活参数达350亿,原生支持256K上下文,并可通过YaRN技术扩展至1M长度,为处理大规模代码库和动态数据提供了坚实支持。

多维训练策略,打造高效代码生成能力

在预训练阶段,通义团队通过多维度扩展策略,显著增强了Qwen3-Coder的代码生成能力。总计7.5TB的训练数据中,代码占比高达70%,确保模型在保持通用性和数学能力的同时,具备出色的编程表现。

在上下文处理方面,该模型专为仓库级代码与动态数据优化,原生支持长上下文处理,大幅提升了Agentic Coding的效率与准确性。此外,团队还采用合成数据扩展技术,利用Qwen2.5-Coder对低质量数据进行清洗与重写,进一步提升整体训练数据质量。

执行驱动强化学习,提升真实任务表现

在后训练阶段,通义团队引入了执行驱动的大规模强化学习策略,通过自动扩展测试样例构建了大量高质量训练数据。该策略不仅显著提高了代码执行成功率,还在多个任务中展现出良好泛化能力。

尤其在真实软件工程任务如SWE-Bench中,Qwen3-Coder展现出卓越的自主规划、工具调用与决策能力,在SWE-bench Verified测试中取得开源模型最佳成绩。

开发者友好工具,提升使用便捷性

为提升开发者体验,通义团队同步开源了命令行工具Qwen Code。该工具对Qwen3-Coder系列模型进行了增强解析器与工具支持,使开发者能够更深入挖掘模型在代理式编程中的潜力。

此外,Qwen3-Coder的API还可与Claude Code、Cline等主流编程工具协同使用,为开发者提供更灵活、高效的编程解决方案。

全面开源,便捷接入全球开发者社区

目前,Qwen3-Coder已在魔搭社区HuggingFace等平台全面开源,全球开发者均可免费下载使用。

与此同时,该模型将很快接入阿里云AI编程产品------通义灵码,进一步拓展其应用场景。阿里云百炼平台也已上线Qwen3-Coder的API接口,为开发者提供更便捷的接入方式。

资源链接