vivo AI突破:端侧多模态模型BlueLM-2.5-3B,GUI界面理解新篇章

AI ToolBox
AI ToolBox
2025年7月10日

突破性AI模型亮相

近日,vivo AI Lab 正式发布了其最新研发的端侧多模态模型------BlueLM-2.5-3B。这款模型不仅体积小巧、运行高效,还具备对图形用户界面(GUI)的理解能力,标志着人工智能在文本与图像处理融合方面迈出了关键一步。

图片

灵活思维机制提升表现

BlueLM-2.5-3B 的一大亮点是支持长短思考模式自由切换,并引入了"思考预算控制"机制,使AI能在深度思考与效率之间实现更佳平衡。 这种设计让它在多项文本和多模态评测任务中脱颖而出,尤其在理解和推理方面展现出超越同类产品的潜力。

测试成绩亮眼

在涵盖20余项评测的任务中,BlueLM-2.5-3B 展现出卓越的文本处理能力,有效缓解了多模态模型常见的"遗忘问题"。 在长思考模式下,它在数学与逻辑推理类任务中的表现明显优于同规模模型;而在多模态理解方面,其性能甚至可媲美更大规模模型,体现出极强的适应性和竞争力。

中文GUI理解能力突出

BlueLM-2.5-3B 在图形用户界面理解方面表现尤为优异,这得益于其训练过程中大量中文应用程序截图数据的支持。 该模型在此类任务中的得分领先于多个竞品,充分展示了 vivo 在人工智能领域的深厚积累与技术创新能力。

轻量结构带来高效体验

为支撑如此出色的性能,BlueLM-2.5-3B 采用精巧的模型架构,参数总量仅为 2.9B ,整体训练与推理成本显著降低。 通过优化的数据利用策略与高效的训练流程,该模型在数据使用效率方面实现了大幅提升,为人工智能的广泛应用提供了坚实基础。

推动AI迈向新高度

BlueLM-2.5-3B 的问世,不仅为终端用户带来了更智能、更流畅的应用体验,也进一步推动了人工智能技术的发展进程。 它的出现,预示着未来AI将在更多场景中发挥关键作用,成为驱动科技进步的重要力量。