京东开源 JoyAgent-JDGenie!GAIA 75.15% 夺冠,多智能体天花板被刷新
GAIA基准领跑,性能卓越
JoyAgent-JDGenie在GAIA基准测试中以75.15% 的总体准确率脱颖而出,刷新了多智能体系统的性能纪录。在不同任务等级中,其表现同样出色:Level1任务准确率超过85% ,Level2任务接近78% ,即便在最复杂的Level3任务中也达到了55%。
与OWL和OpenManus等竞品相比,JoyAgent-JDGenie在准确率上具有明显优势。GAIA基准强调真实世界任务的模拟,涵盖多模态处理、工具使用与复杂推理,被广泛视为评估AI智能体能力的"金标准"。该系统的高分表现充分展示了其在多种应用场景下的适应能力与潜力。
端到端多智能体框架,开箱即用
JoyAgent-JDGenie是一款完整的端到端多智能体系统,用户只需输入查询或任务,即可直接获得解决方案。系统集成了前端、后端、核心引擎及多个子智能体模块,包括报告生成、代码处理、PPT制作和文件管理等,适用于多样化的业务场景。
开发者还可以灵活扩展功能,例如接入Web搜索API或Python解释器等外部工具,以满足特定需求。相比传统单一智能体架构,JoyAgent-JDGenie采用多层级协作机制,通过任务分解与智能体协同高效完成复杂操作。
例如,当用户输入"生成一份关于2025年AI趋势的PPT"时,系统会自动分配任务给PPT智能体与数据分析智能体,协同完成内容与图表的整合,显著降低开发门槛,加快企业AI应用的部署进程。
多模态与记忆优化,智能更进一步
JoyAgent-JDGenie的一大亮点在于其多模态支持能力,系统可处理文本、图像、代码等多种输入输出形式,胜任GAIA基准中的多模态任务,如解析PDF文档、分析图像内容或处理音频数据。
同时,系统引入了跨任务级别的记忆机制,能够基于历史任务优化当前处理流程。例如在重复生成类似报告时,系统可调用过往数据,减少重复计算,提升响应效率。
在GAIA Level3任务中,系统展现出强大的链式推理能力,结合外部工具准确回答涉及多源信息整合的问题,如"根据某幅画作和历史记录提取特定信息"。这一能力使其在内容创作、数据分析和自动化流程中具备广泛的应用前景。
开源生态,助力开发者创新
JoyAgent-JDGenie采用Apache2.0开源协议,提供完整的前端、后端、引擎及核心模块源码,开发者可自由进行二次开发或部署应用。项目配套了详尽的文档和快速入门指南,兼容Windows、Linux等多种平台,适配主流硬件环境。
其模块化设计也极大提升了扩展性。开发者可轻松添加新的子智能体,例如专用于金融分析或医疗数据处理的智能体,快速实现系统定制化。
京东团队表示将持续优化框架,计划引入本地化大语言模型支持与更高效的推理加速技术,降低对云端API的依赖,进一步提升性能并控制成本。
多智能体系统的未来风向
JoyAgent-JDGenie的发布标志着多智能体系统在开源领域迈出了重要一步。其在GAIA基准中的领先表现,不仅彰显了京东在AI技术上的深厚积累,也为AI应用的企业级落地提供了可行路径。
随着多智能体系统在任务协作、工具整合和多模态处理方面持续进化,类似JoyAgent-JDGenie的框架有望成为推动AI普及的重要引擎。
开发者可通过访问其GitHub仓库快速部署:只需下载源码并配置环境,即可轻松上手。无论是构建智能客服、自动化报告系统,还是复杂的数据分析工具,这款框架都值得一试。
- 项目地址: GitHub仓库