Mistral AI发布Devstral:240亿参数开源AI模型,赋能软件工程

AI ToolBox
AI ToolBox
2025年7月11日

全新推出 Devstral Small1.1 与 Devstral Medium2507

近日,Mistral AI 联合 All Hands AI 正式发布面向开发者的大型语言模型 Devstral2507 系列 ,包括两款型号:Devstral Small1.1Devstral Medium2507。这两款模型专注于增强代码推理、程序合成及结构化任务执行能力,特别适用于大规模软件项目的实际需求。

图片

此次发布的模型在性能与成本控制方面进行了优化,具备在开发工具链和代码自动化系统中广泛应用的潜力。

Devstral Small1.1:轻量级开源模型,支持本地部署

Devstral Small1.1 是一款基于 Mistral-Small-3.1 构建的开源模型,参数规模约为 240 亿,支持 128k 上下文长度,可高效处理多文件代码输入与复杂提示。

该模型经过专门微调,能够输出如 XML 和函数调用等结构化格式,完美兼容 OpenHands 等代理框架,胜任程序导航、多步骤编辑与代码检索等任务。

其采用 Apache2.0 许可协议,允许研究与商业使用。

  • 支持 128k 上下文窗口
  • 优化结构化输出格式
  • 兼容主流代理框架
  • 许可开放,便于部署

性能测试表现亮眼,性价比突出

在 SWE-Bench Verified 基准测试中,Devstral Small1.1 取得 53.6% 的通过率,展现了其为真实 GitHub 问题生成修复补丁的能力。

尽管未达到超大商业模型的水平,但在模型体积、推理效率与功能表现之间达到了良好平衡,适合多种编程场景。

灵活部署选项,满足多样需求

该模型提供多种部署形式,包括可在高内存 GPU(如 RTX4090)或配备 32GB RAM 以上的 Apple Silicon 设备上运行的量化版本。

Mistral 还通过其 API 提供模型服务,当前收费标准与 Mistral-Small 系列保持一致。

Devstral Medium2507:企业级高性能模型

Devstral Medium2507 仅通过 Mistral API 或企业私有部署方式提供,不对外开放源码。

在 SWE-Bench Verified 测试中获得 61.6% 的成绩,在长文本推理方面超越了部分商业模型,例如 Gemini2.5Pro 和 GPT-4.1。

虽然其 API 费用高于 Small 版本,但强大的推理能力使其非常适合用于大规模代码库中的关键任务。

不同定位,协同应用

Devstral Small 更适合本地开发、实验验证或集成至客户端工具;而 Devstral Medium 则在结构化代码编辑任务中展现更高的准确率与一致性,是生产环境的理想选择。

两款模型均支持与代码代理框架集成,助力实现测试生成、重构优化与错误自动修复等自动化流程。

总结:满足多样化软件工程需求

借助本次发布的 Devstral2507 系列,Mistral AI 为开发者提供了更丰富的模型选择,从实验性代理构建到企业级部署均可获得有效支撑。