返回上一页

vivo AI突破：端侧多模态模型BlueLM-2.5-3B，GUI界面理解新篇章

AI ToolBox

AI ToolBox

2025年7月10日

突破性AI模型亮相

近日，vivo AI Lab 正式发布了其最新研发的端侧多模态模型------BlueLM-2.5-3B。这款模型不仅体积小巧、运行高效，还具备对图形用户界面（GUI）的理解能力，标志着人工智能在文本与图像处理融合方面迈出了关键一步。

灵活思维机制提升表现

BlueLM-2.5-3B 的一大亮点是支持长短思考模式自由切换，并引入了"思考预算控制"机制，使AI能在深度思考与效率之间实现更佳平衡。这种设计让它在多项文本和多模态评测任务中脱颖而出，尤其在理解和推理方面展现出超越同类产品的潜力。

测试成绩亮眼

在涵盖20余项评测的任务中，BlueLM-2.5-3B 展现出卓越的文本处理能力，有效缓解了多模态模型常见的"遗忘问题"。在长思考模式下，它在数学与逻辑推理类任务中的表现明显优于同规模模型；而在多模态理解方面，其性能甚至可媲美更大规模模型，体现出极强的适应性和竞争力。

中文GUI理解能力突出

BlueLM-2.5-3B 在图形用户界面理解方面表现尤为优异，这得益于其训练过程中大量中文应用程序截图数据的支持。该模型在此类任务中的得分领先于多个竞品，充分展示了 vivo 在人工智能领域的深厚积累与技术创新能力。

轻量结构带来高效体验

为支撑如此出色的性能，BlueLM-2.5-3B 采用精巧的模型架构，参数总量仅为 2.9B ，整体训练与推理成本显著降低。通过优化的数据利用策略与高效的训练流程，该模型在数据使用效率方面实现了大幅提升，为人工智能的广泛应用提供了坚实基础。

推动AI迈向新高度

BlueLM-2.5-3B 的问世，不仅为终端用户带来了更智能、更流畅的应用体验，也进一步推动了人工智能技术的发展进程。它的出现，预示着未来AI将在更多场景中发挥关键作用，成为驱动科技进步的重要力量。