昆仑万维Skywork-R1V 3.0:强化学习激发跨模态推理潜能
AI ToolBox
2025年7月9日
领先技术打造新一代多模态模型
近日,昆仑万维正式推出其最新开源模型 Skywork-R1V3.0,在多模态推理方面实现了重大突破,甚至达到接近人类初级专家的水平。通过引入强化学习策略,该模型在复杂逻辑建模与跨学科知识泛化能力上展现出显著优势。
冷启动训练方法构建高质量数据集
Skywork-R1V3.0 在前代版本基础上采用"冷启动"方式,结合高精度蒸馏数据与拒绝采样技术,成功构建出高效多模态推理训练集。与传统文本为中心的模型不同,它深度融合图像处理能力,极大提升了图文交互推理的表现力。
小样本激发强大性能
令人瞩目的是,该模型仅依赖约1.2万条监督微调样本和1.3万条强化学习样本,就展现出卓越的学习效率,印证了"小数据激发大能力"的潜力。在权威评测 MMMU 中,Skywork-R1V3.0 以76.0分的成绩超越 Claude-3.7-Sonnet(75.0分) 和 GPT-4.5(74.4分) 等主流闭源模型,彰显其出色的跨模态理解能力。
物理与逻辑推理表现出色
在具体应用层面,Skywork-R1V3.0 在多个专业领域展现出强劲实力。例如在物理推理评测中取得52.8分和31.5分的最佳开源成绩;在逻辑推理测试中也斩获59.7分的优异表现,充分体现出其对复杂问题的解析能力。
数学推理能力全面领先
在数学相关任务中,Skywork-R1V3.0 同样展现强大实力:
- MathVista:77.1分
- MathVerse:59.6分
- MathVision:52.6分
这些成绩不仅优于其他开源模型,更标志着该模型在多模态数学推理方向上的领先地位。
推动AI技术迈向新高度
Skywork-R1V3.0 的问世标志着多模态推理技术迈入新阶段。凭借其强大的性能和完全开源的特性,该模型将为人工智能的发展注入新的动力,助力科研与产业应用实现更多突破。